自然言語処理スレッド　その５

[過去ﾛｸﾞ] 自然言語処理スレッド　その５ (1002ﾚｽ)
上下前次1-新
抽出解除必死ﾁｪｯｶｰ(本家) (べ) 自ID ﾚｽ栞あぼーん

このｽﾚｯﾄﾞは過去ﾛｸﾞ倉庫に格納されています｡
次ｽﾚ検索歴削→次ｽﾚ栞削→次ｽﾚ過去ﾛｸﾞﾒﾆｭｰ

777: ことのは 2020/03/12(木)01:15 ID:/YIFSAvr(1/14) AAS
>>771
昔はコンパイラだとかの言語処理も
人工知能の研究範囲だったらしいね？
人間がしてた最適化を機械でできた

だから全部いっぺんに生成するのは
AIではできないけど部分的な自動化
できる部分は拡大していくだろうよ

また前からしてるRPAの話につなげると
プロセスマイニングとかでより効率的な
RPAの命令を生成するのはそれに近くて
省10

778: ことのは 2020/03/12(木)01:33 ID:/YIFSAvr(2/14) AAS
>>773
「曖昧な日本の私」みたいな
日本語の係り受けの曖昧さの問題だね！

これは二番目が一番標準的な解析になるべきだと考える

なぜならまず係り受けが最小で連続しててキレイでしょ？
それから日常的にも一番出現確率が高そうな場面だよね？

だけどそれだけが唯一の正解って訳じゃなくて……

779: ことのは 2020/03/12(木)01:33 ID:/YIFSAvr(3/14) AAS
>>774
前後の文を見てコンテクストを拡張しよう
っていうのももちろんあるやり方だし

また「マルチモーダル」や「人間との共同作業」が
実現できる環境なら、たんにそれらの画像を生成して
ユーザに選択させれば意図は確実に分かる

まあこの例だとナンセンスな気がするけどたとえば
「A社のようにコストが高くつかないシステム」で
A社のシステムのコストが高いか高くないかが
ビジネスで重要な問題になるかもしれないとかだと
省1

780: ことのは 2020/03/12(木)01:40 ID:/YIFSAvr(4/14) AAS
>>775
だからこれも一番自然に読むなら
「瞳」が「黒」で
「女の子」が「大きい」はずだね

「瞳」が「大きい」
「女の子」が「黒い」とかだと
係り受けが飛ぶしやや不自然だから

781: ことのは 2020/03/12(木)01:40 ID:/YIFSAvr(5/14) AAS
>>776
＞作者の気持ち
＞複数の意味
これは難しいが高度な自然言語処理としてはありうる

たとえばお世辞で褒めてるとか
皮肉で逆の意味を示してるとか

今のテキストマイニングの
感情表現とかの情報抽出は
まだそのレベルまで行ってないだろうけど

Prologの自由変数の非決定性みたいな
省3

792: ことのは 2020/03/12(木)20:11 ID:/YIFSAvr(6/14) AAS
>>782
汎用性を求めず限定すればできるだろうね
つまり強いAIじゃなくて弱いAIでいいなら

>>784
＞GoogleのBERT
は非常に有力だね

ただいくら機械学習の精度が上がろうとも
「A社のようにコストが高くつかないシステム」で
A社のシステムのコストが高いか高くないかは
本人に聞ける場面なら聞いた方が確実だから
省3

793: ことのは 2020/03/12(木)20:12 ID:/YIFSAvr(7/14) AAS
>>783
>>786
人間も母語を習得するのに
幼少期に何年も掛かるから
大量のコーパスに触れてる

794: ことのは 2020/03/12(木)20:15 ID:/YIFSAvr(8/14) AAS
>>785
>>788
＞"s=1+2+3+4+5+6+.…+99+100"
これは「足し算の項が十以上になったら
For文で書け」みたいなルールを課せばいい

機械学習の流行でルールベースは
もうオワコンみたいな風潮だけど
たとえ機械学習で知識獲得させても
それと並行してルールも有効だと思う

795: ことのは 2020/03/12(木)20:19 ID:/YIFSAvr(9/14) AAS
>>787
人間は学習の質が違うからね
質より量が機械学習

>>790
＞積み木のパーツを組み合わせてオブジェクトを作るみたいに
＞コンピュータ言語の構文組み合わせてプログラムを作る

それは「遺伝的プログラミング」だね
今あまり流行らないがLispが得意な奴

＞組み合わせを探索して
＞解の集合を絞り込む
省1

796(1): ことのは 2020/03/12(木)20:24 ID:/YIFSAvr(10/14) AAS
あとRPAの話題を続けて言えば
プロセスマイニングと
テキストマイニングを合わせて使うことで
シナジーが生じないか考えてる

たとえばRPAの操作ごとに
自然文を入力もしくは出力して
ログを溜めておき
定期的にマイニングすると

操作データと文章データを比較することで
何か得る物があるかもしれない
省4

798(1): ことのは 2020/03/12(木)21:06 ID:/YIFSAvr(11/14) AAS
>>797
スマートスピーカーとかは
当然のように情報収集してるだろうね

そもそも昔から検索エンジンの
クエリが情報源になってると思うけど

「データイズキング」で
ビッグデータを取れる
プラットフォームがAIには有利だな

このままだとグーグルやアマゾンに
全産業が寡占されそうで危機感ある

799: ことのは 2020/03/12(木)21:08 ID:/YIFSAvr(12/14) AAS
reCAPTCHA - Wikipedia
https://ja.wikipedia.org/wiki/ReCAPTCHA

あんまりマニアックな論文とか紹介すると
手口がバレちゃうけどこれは有名な例だからいいかな

このreCAPTCHAはシステムの裏で
人間から情報収集する典型例だと思う

さっきのRPAでプロセスとテキストを
両方マイニングすればいいのでは
っていう発想の元ネタになってる

あとこれもカーネギーメロン大だね
省1

803: ことのは 2020/03/12(木)22:17 ID:/YIFSAvr(13/14) AAS
>>801
GUIからCUI（音声認識含む）に戻す
っていうのはシンプルだけど
大きな需要があると思ってる

たとえばスマートスピーカーは
とくにキッチンとかで手が離せない
状況の時に役立つからね

PCのGUIは残ると思うが
スマホも画面小さいから
複雑な操作はしにくいし

804(1): ことのは 2020/03/12(木)22:28 ID:/YIFSAvr(14/14) AAS
>>802
囲碁AIが「独学」で最強に　グーグル、産業応用探る　日経
https://www.nikkei.com/article/DGXMZO22407340Y7A011C1TI1000/

最近の機械学習は自己学習できるようになってるよね

ただ囲碁や画像処理みたいに
公開された情報だけで白黒つく分野と
そうでない分野があるから
情報収集が全部不要になるとは限らないんだ

たとえば株価なんかはいくら学習の精度が上がっても
株価だけで正確に予測できるようになるのは難しい
省9

上下前次1-新書関写板覧索設栞歴

ｽﾚ情報赤ﾚｽ抽出画像ﾚｽ抽出歴の未読ｽﾚ AAｻﾑﾈｲﾙ

ぬこの手ぬこTOP 1.892s*