[過去ログ] 自然言語処理スレッド その5 (1002レス)
前次1-
抽出解除 必死チェッカー(本家) (べ) 自ID レス栞 あぼーん

このスレッドは過去ログ倉庫に格納されています。
次スレ検索 歴削→次スレ 栞削→次スレ 過去ログメニュー
777: ことのは 2020/03/12(木)01:15 ID:/YIFSAvr(1/14) AAS
>>771
昔はコンパイラだとかの言語処理も
人工知能の研究範囲だったらしいね?
人間がしてた最適化を機械でできた

だから全部いっぺんに生成するのは
AIではできないけど部分的な自動化
できる部分は拡大していくだろうよ

また前からしてるRPAの話につなげると
プロセスマイニングとかでより効率的な
RPAの命令を生成するのはそれに近くて
省10
778: ことのは 2020/03/12(木)01:33 ID:/YIFSAvr(2/14) AAS
>>773
「曖昧な日本の私」みたいな
日本語の係り受けの曖昧さの問題だね!

これは二番目が一番標準的な解析になるべきだと考える

なぜならまず係り受けが最小で連続しててキレイでしょ?
それから日常的にも一番出現確率が高そうな場面だよね?

だけどそれだけが唯一の正解って訳じゃなくて……
779: ことのは 2020/03/12(木)01:33 ID:/YIFSAvr(3/14) AAS
>>774
前後の文を見てコンテクストを拡張しよう
っていうのももちろんあるやり方だし

また「マルチモーダル」や「人間との共同作業」が
実現できる環境なら、たんにそれらの画像を生成して
ユーザに選択させれば意図は確実に分かる

まあこの例だとナンセンスな気がするけどたとえば
「A社のようにコストが高くつかないシステム」で
A社のシステムのコストが高いか高くないかが
ビジネスで重要な問題になるかもしれないとかだと
省1
780: ことのは 2020/03/12(木)01:40 ID:/YIFSAvr(4/14) AAS
>>775
だからこれも一番自然に読むなら
「瞳」が「黒」で
「女の子」が「大きい」はずだね

「瞳」が「大きい」
「女の子」が「黒い」とかだと
係り受けが飛ぶしやや不自然だから
781: ことのは 2020/03/12(木)01:40 ID:/YIFSAvr(5/14) AAS
>>776
>作者の気持ち
>複数の意味
これは難しいが高度な自然言語処理としてはありうる

たとえばお世辞で褒めてるとか
皮肉で逆の意味を示してるとか

今のテキストマイニングの
感情表現とかの情報抽出は
まだそのレベルまで行ってないだろうけど

Prologの自由変数の非決定性みたいな
省3
792: ことのは 2020/03/12(木)20:11 ID:/YIFSAvr(6/14) AAS
>>782
汎用性を求めず限定すればできるだろうね
つまり強いAIじゃなくて弱いAIでいいなら

>>784
>GoogleのBERT
は非常に有力だね

ただいくら機械学習の精度が上がろうとも
「A社のようにコストが高くつかないシステム」で
A社のシステムのコストが高いか高くないかは
本人に聞ける場面なら聞いた方が確実だから
省3
793: ことのは 2020/03/12(木)20:12 ID:/YIFSAvr(7/14) AAS
>>783
>>786
人間も母語を習得するのに
幼少期に何年も掛かるから
大量のコーパスに触れてる
794: ことのは 2020/03/12(木)20:15 ID:/YIFSAvr(8/14) AAS
>>785
>>788
>"s=1+2+3+4+5+6+.…+99+100"
これは「足し算の項が十以上になったら
For文で書け」みたいなルールを課せばいい

機械学習の流行でルールベースは
もうオワコンみたいな風潮だけど
たとえ機械学習で知識獲得させても
それと並行してルールも有効だと思う
795: ことのは 2020/03/12(木)20:19 ID:/YIFSAvr(9/14) AAS
>>787
人間は学習の質が違うからね
質より量が機械学習

>>790
>積み木のパーツを組み合わせてオブジェクトを作るみたいに
>コンピュータ言語の構文組み合わせてプログラムを作る

それは「遺伝的プログラミング」だね
今あまり流行らないがLispが得意な奴

>組み合わせを探索して
>解の集合を絞り込む
省1
796
(1): ことのは 2020/03/12(木)20:24 ID:/YIFSAvr(10/14) AAS
あとRPAの話題を続けて言えば
プロセスマイニングと
テキストマイニングを合わせて使うことで
シナジーが生じないか考えてる

たとえばRPAの操作ごとに
自然文を入力もしくは出力して
ログを溜めておき
定期的にマイニングすると

操作データと文章データを比較することで
何か得る物があるかもしれない
省4
798
(1): ことのは 2020/03/12(木)21:06 ID:/YIFSAvr(11/14) AAS
>>797
スマートスピーカーとかは
当然のように情報収集してるだろうね

そもそも昔から検索エンジンの
クエリが情報源になってると思うけど

「データ イズ キング」で
ビッグデータを取れる
プラットフォームがAIには有利だな

このままだとグーグルやアマゾンに
全産業が寡占されそうで危機感ある
799: ことのは 2020/03/12(木)21:08 ID:/YIFSAvr(12/14) AAS
reCAPTCHA - Wikipedia
https://ja.wikipedia.org/wiki/ReCAPTCHA

あんまりマニアックな論文とか紹介すると
手口がバレちゃうけどこれは有名な例だからいいかな

このreCAPTCHAはシステムの裏で
人間から情報収集する典型例だと思う

さっきのRPAでプロセスとテキストを
両方マイニングすればいいのでは
っていう発想の元ネタになってる

あとこれもカーネギーメロン大だね
省1
803: ことのは 2020/03/12(木)22:17 ID:/YIFSAvr(13/14) AAS
>>801
GUIからCUI(音声認識含む)に戻す
っていうのはシンプルだけど
大きな需要があると思ってる

たとえばスマートスピーカーは
とくにキッチンとかで手が離せない
状況の時に役立つからね

PCのGUIは残ると思うが
スマホも画面小さいから
複雑な操作はしにくいし
804
(1): ことのは 2020/03/12(木)22:28 ID:/YIFSAvr(14/14) AAS
>>802
囲碁AIが「独学」で最強に グーグル、産業応用探る 日経
https://www.nikkei.com/article/DGXMZO22407340Y7A011C1TI1000/

最近の機械学習は自己学習できるようになってるよね

ただ囲碁や画像処理みたいに
公開された情報だけで白黒つく分野と
そうでない分野があるから
情報収集が全部不要になるとは限らないんだ

たとえば株価なんかはいくら学習の精度が上がっても
株価だけで正確に予測できるようになるのは難しい
省9
前次1-
スレ情報 赤レス抽出 画像レス抽出 歴の未読スレ AAサムネイル

ぬこの手 ぬこTOP 1.892s*