[過去ログ] 自然言語処理スレッド その4 (1002レス)
1-

このスレッドは過去ログ倉庫に格納されています。
次スレ検索 歴削→次スレ 栞削→次スレ 過去ログメニュー
リロード規制です。10分ほどで解除するので、他のブラウザへ避難してください。
1
(4): 2014/06/03(火)05:40 ID:yefNLumx(1) AAS
前前スレ 自然言語処理スレッド その2
外部リンク:mimizun.com
前スレ 自然言語処理スレッド その3
外部リンク:mimizun.com

このスレッドでは、日本語の構文解析、談話理解、情報検索、
文章生成などの技術に関する理論と(おもに)実装を扱います。
あくまでアプリケーションプログラミングの技術的な面に重点をおきたいので、
学術的な話はアリですが、いわゆる人工無能や哲学的AI話、
言語学の話題などは他のスレッドでお願いします。
973: Mr.Moto 2018/09/17(月)05:01 ID:rTQuL7Ni(2/20) AAS
>>972
そもそもは、たまたま「ローマ字かな変換とかな漢字変換の
両方が、双方向で簡単にできる」というシステムを作っちゃった
のが発端なんだ。“sinai” が「市内」なのか「竹刀」なのか「親愛」
なのか「sin(ai)」の判別を、構文解析・意味解析・意味解析の
レベルまで保留しておこうとか、ずっと考えてたんだよね。
あるいは「ふたえにまげてくびにかけるじゅず」が「二重に曲げ
手首にかける数珠」なのか「二重に曲げて首にかける数珠」なのか。
「ここではきものをぬいでください」が「ここでは着物を脱いでください」
なのか「ここで履物を脱いでください」なのか。
あるいは、読みを「開く/閉じる」の問題。「話」は名詞だけど「話し」
と書くと動詞の連用形現在になるので、ニュアンスが変わっちゃうとか、
「持ち帰り」か「持帰り」か「持ちかえり」かとか、「書留」は「書留め」
でも「書き留め」でもないけど「書きとめる」は「書き止める」と
書くと「書きとどめる」になるとか、「出だし」は「出出し」と書かないとか、
「とにかく」か「兎に角」かとか「ください」か「下さい」かとか、
そういう「実用的な部分で引っかかるところ」というものに対して、
昨今の自然言語処理の研究者って向かい合ってないように思うんだよ。
「それは文法や文学の問題であって、科学技術の観点からいうと
些末な問題でしかない」と。このスレでも、文法に対する忌避反応と
いうのがあるだろう? だけど、「実用」「応用」を考えると、
それは切り捨てちゃいけないことだと思うんだけどね。
974: Maria 2018/09/17(月)05:21 ID:rTQuL7Ni(3/20) AAS
>>970
一九五九年に電気試験所で作られた翻訳機械の名前が「やまと」。
975: 2018/09/17(月)05:35 ID:rTQuL7Ni(4/20) AAS
>>971
現代数学的な構成主義によれば、
「2+2=4」。
「1の “次の数” 」として2が定義され、
それを前提として加法が定義される。
この時点で「2+2=4」が導入され、
そこからさらに定義を延長することで、
「1+1=2」が帰結され、加法の
逆操作として減算を考えることで
負数を含めた整数が定義される。
これとは別に、加法のくり返しとしての
乗算が定義されるんだが、乗法の逆演算としての
除法を考えると「0」の扱いがややこしいことになり、
インドでは0が「悪魔の数字」と呼ばれることになる。

このあたりを掌握できる自然言語処理システムとか
考えだすと、あんまり実装っぽい話にならんで
AI 哲学みたいな話になっちゃうんだよなぁ。
976
(1): 2018/09/17(月)07:13 ID:C7pw6n1T(1/8) AAS
>>371
>25000×25000=626000000通りの「共起関係」、
>及び29種類の「属性」を、人力で分析してアノテーションコーパスを作成すべき!

『頻出』と『例外』を検出しておきたい。
977
(1): 2018/09/17(月)07:24 ID:C7pw6n1T(2/8) AAS
自然言語処理の知識はゼロなのでわからないです。面白いアイデアだと思うので、Twitterの自然言語処理が専門の方々に聞いてみては?
外部リンク:peing.net

コンピューターのための自然言語理解シミュレ
ーターというのは可能ですか?

例えば第二次大戦の推移について、言葉ではな
くて動画で理解する方法もあります。
言葉で説明するよりもマインクラフトのような
創作ゲーム表現に変えたほうが分かりやすいで
す。
けれども自分が読み漁った人工知能や自然言語
処理の本にはそうしたアプローチは見つからな
かったです。
言語はただの記号の羅列で機械は現実世界を全
く知らない。でもそういうことなら、
テレビゲームのような仮想世界をインプットし
て、自然言語で操作したらいいと思います。
というか自然言語入力でときめきメモリアルみ
たいなゲームをやってみたいてす。
978: 2018/09/17(月)07:27 ID:C7pw6n1T(3/8) AAS
教育重視のシナリオの場合は、AI の脳が正しく正確なデータに基づいて学習することを確実にしつつも、
技術の成功と安全性のために はセンサー情報が不可欠です。AirSim を AI 実験、ディープ ラーニング、
強化学習用のためのツールとして改変させ続けることが、本研究プ ロジェクトにおける Microsoft の狙いです。
人工知能がエキサイティングに進化する時代に突入しました。ツールと技術が一 般化して不可能なことも
すぐに可能となるでしょう。アンリアル エンジンを使って多種多様な設計およびリサーチ業界全体で
AI 開発と教育 アプローチを可能にすることで、次世代の人工知能の進化において解き放たれる潜在的な進歩の
大きなレベルがあります。次世代に向けて人工 知能はとてつもなく大きな進歩が期待できます。

2018.4.13
バーチャル シミュレーションを活用してアンリアル エンジンで AI を教育する
外部リンク:www.unrealengine.com
979: 2018/09/17(月)07:50 ID:C7pw6n1T(4/8) AAS
>>940
>コンピュータに「常識」を持たせてあげないと、
>「〇と×のいずれかを」を「〇 xor × のいずれか一方を」
>と解釈してくれなくて、

コンピューターに『人間の常識』を教えるには、一つ一つ丹念にインプットするかシミュレーションしかない。
『AとBのいずれか』『AとBの両方』は、頻出概念として予め人力で登録しておく。
980: 2018/09/17(月)07:55 ID:C7pw6n1T(5/8) AAS
>>459
>【数学の大学入試問題、被りすぎやろ(2017年入試)】

入試数学はパターンが非常に限られているので、丹念に人力インプットするだけでもいい。
2016年の東ロボのような時代遅れの統計的機械翻訳でも偏差値76.2を記録しまのだから。
981
(1): 2018/09/17(月)07:58 ID:C7pw6n1T(6/8) AAS
>>966
>「でも、『絶対に』というのは、『例外なく』という意味ですよね?」

例外は例外として、人力でインプットするしかないと思う。
982: 2018/09/17(月)08:08 ID:C7pw6n1T(7/8) AAS
国民的番組の笑いを生んだ『8時だョ!全員集合』の舞台セットデザイン
外部リンク:wired.jp

言語理解シミュレーションのための舞台セットも用意しておきたい!
983
(1): 2018/09/17(月)08:22 ID:rTQuL7Ni(5/20) AAS
新スレを立てようと思ったら、なんかのNGワードで
引っかかってんだが、どこで引っかかってんのか判らん。
(自然言語処理をやってる人間がなんてざまだ (-_-!))
とりあえず誰か

自然言語処理スレッド その5
このスレッドでは、おもに日本語の構文解析・談話理解・情報検索・
文章生成などの、実装とそれに付帯する技術および理論について
扱いたいと思っています。

で立てといてくれ。
984
(1): 2018/09/17(月)08:38 ID:C7pw6n1T(8/8) AAS
>>967
>人間がどう解釈するかっていうのは、けっきょく人間の都合じゃねぇの?

『1秒ごとに』という日本語もねーーーwww

y=9.8x(m/秒)の解釈が『1秒ごとに秒速9.8メートルずつ速度が上がる』というのは数学を持ち出すまで
もなく物理的におかしいでしょう。そんな奇妙な加速をしながら落下する玉を私は見たことがありません。
この本は中高生向けの本なのですが、読解力のある中高生はこの文章を読むと間違った知識を手に入れることになります。
なんとなく『1秒ごとに秒速9.8メートルずつ速度が上がる玉』が、どのような動きなのか気になったので
以下にプログラムを書いてみました。新井紀子教授の世界(Norico’s World)を私たちの世界
(Our World)と合わせてご覧ください。
外部リンク:mywarstory.tokyo
985: 2018/09/17(月)08:50 ID:rTQuL7Ni(6/20) AAS
>>977
古典的なところでは、積木の世界をターゲットにした
SHRDLUがある。とはいえ、自然言語処理が
人工知能のサブジャンルであるとしても、
自動車の自動運転技術とかが別にあるので
別々に開発して統合するというのも
ひとつの方法だと思う。

ゲームとしての面白さを追求するなら、
人工知能を搭載した軍艦と戦車と航空隊を
日本語で統制するとかいったシミュレーション・
ウォーゲームとかがいいんじゃないだろうか?
「アンノウンは警告に応答しない。依然高度を
下げつつ南下中。火器使用の許可を願う。送れ」
「火器の使用を許可する。送れ」
みたいなのはイケると思う。
「ばかもん。俺のケツを舐めろ」とか、
ぜってー誰かやりそうだが。
986
(1): 2018/09/17(月)09:08 ID:rTQuL7Ni(7/20) AAS
>>984
> y=9.8x(m/秒)の解釈が『1秒ごとに秒速9.8メートルづつ
> 速度が上がる』という
物理を齧った奴だったら、「v=gt (SI 単位系。g ≒ 9.80665 m/sec^2)」
と書いてほしいだろうし、一目見て「真空中の自由落下だろうけど、
どのくらいの規模と精度を考えてるんだろうか?」と考えるだろう。
コンピュータに物理学や力学のセンスを持たせるためにも、
「われわれ人間にとっての “自明性” の正体ってなんだろう?」という
点について掘り下げる必要があると思う。おれなんかは高機能自閉だから、
そういう意味では人生のうちの多くを「自分の行動を妨げる壁」としての
「自明性との闘い」に費やしているので、自然言語処理の研究者に
向いてるっちゃあ向いてると思っているが。
987
(3): 2018/09/17(月)09:47 ID:Ep0iz6P/(1) AAS
>>986
>そういう意味では人生のうちの多くを「自分の行動を妨げる壁」としての
>「自明性との闘い」に費やしているので、自然言語処理の研究者に
>向いてるっちゃあ向いてると思っているが。

けれども学会のお偉方というのは、僕らのような無名人の相手は殆どしない。

>>719
>それが学会で評価されると信じるのは、「いつか王子様が」
>みたいなファンタジーでしかない。

死期になったら辞世の句を添えて自費出版、評価されるのは死後でいい。
988: Mr.Moto 2018/09/17(月)11:51 ID:rTQuL7Ni(8/20) AAS
次スレ
『自然言語処理スレッド その5』
2chスレ:tech

>>983
「立った! クララが立った!」
989
(1): Mr.Moto 2018/09/17(月)12:02 ID:rTQuL7Ni(9/20) AAS
>>987
そういえば、自然言語処理と(形態素解析レベルの)国文法の
両方の話ができる学会って、どっかにあるんだろうか。
自然言語処理関係の学会で国文法関連の話をすると、あからさまに
厭な顔をされる。
さりとて国文法関連の学会で自然言語処理関連の話をすると、
みなさん逃げ腰になる。

かといって、現代国語の文法を教えている中学校の教諭や、
文語文法を教えている高校の教諭は、「文法」と聞いただけで
面相と顔色が変わるので、教育関係(国語強意kとコンピュータ・
リテラシーとか)関連の学会からも歓迎されないらしい。

だれか、「こういう集まりがあるぞ?」という心当たりのある
方はいらっしゃらないか?

まぁ、おれみたいな強面のおっさんと顔を合わせたくない奴は
多いだろうが、Maria もいるこったし、「お前は出てくんな」と
言われたら、なるべく出てこないようにするが、どうか。
990: Mr.Moto 2018/09/17(月)12:10 ID:rTQuL7Ni(10/20) AAS
>>989
『言語処理学会』
外部リンク:www.anlp.jp)って、
ぶっちゃけ どんな雰囲気なの?
だれか関係してる人っている?
991: Maria 2018/09/17(月)12:19 ID:rTQuL7Ni(11/20) AAS
つーか、『自然言語処理学会』っていうのがあるらしいんだけど、
『言語処理学会』と URL が一緒なのよね。
で、国語学に関しては、『計量国語学会』
外部リンク:www.math-ling.org)っていうのがあるらしいんだけど、
どんな雰囲気なの? だれか知ってる人っている?
992: 2018/09/17(月)12:22 ID:rTQuL7Ni(12/20) AAS
>>987
> 死期になったら辞世の句を添えて自費出版、評価されるのは死後でいい。
おれが死ぬまで待ってたら、おれが死ぬまで待ってなきゃいけない
奴が出るだろうがよ。
おれも目の黒いうちに成果を見届けたいし、
視覚障害者・聴覚障害者の方々は、
一刻も早く対処してほしいと思ってるんだよ。
だろ?
993: 2018/09/17(月)12:36 ID:rTQuL7Ni(13/20) AAS
>>987
> けれども学会のお偉方というのは、僕らのような
> 無名人の相手は殆どしない。
意外にそうでもない(まぁ、創価学会とかだと別かもしれんが)。
日本ソフトウェア科学会の総会に出たら、委任状が集まんなくて
「総会が成立しない」というので大騒動になったことがあって、
隣でニヤニヤしながら懇親会用のビールを飲んでいるオッサンが
いたので、よく見たら渕 一博先生だったことがある。
「ロジック・プログラミング・コンファレンス」の大会に行ったら、
隣で「痛たたたたた」と苦しんでいるジイサンがいたので、「大丈夫ですか?」
と訊いたら、「いや、今年の大雪で、大学の敷地内で転んで大腿骨を骨折
しまして」とおっしゃるので「元気なジジイだな」と思いつつも「何かあったら
おっしゃってくださいね」と言ったら、「私、こういう者です」という名刺を出されて
見たら一松 信先生 m(_ _)m
本当に偉いジジババは、生い先短いから、面白いネタに貪欲なんだと思う。
「ザコに構ってる暇がない」んであって、本当に面白いネタを持ってくか
どうかだと思う。
994: 2018/09/17(月)12:40 ID:rTQuL7Ni(14/20) AAS
>>981
> 例外は例外として、人力でインプットするしかないと思う。
例外を認めたら論理が破綻するので、
「人力でインプットする」ことを認めちゃダメだと思う。
995: 2018/09/17(月)14:13 ID:rTQuL7Ni(15/20) AAS
>>944
> 「人力でインプットする」ことを認めちゃダメだと思う。
つーか、「入力」と「インプット」は同義語なんで、
本来は「人力でインプットする」は冗語なのだ、と思う。

とはいえ、「情報」と「データ」の違いについて
理解していない人が多いので、「通じない言語は
言語としての意味があるのか?」という疑問を
感じた。
996: 2018/09/17(月)14:39 ID:rTQuL7Ni(16/20) AAS
>>976
共起関係つーか連接関係については
某企業で科研費を貰っているというので
成果を上げないとヤヴァイ、というので
尻拭いで やったことがあるが、
担当者が相関表を読めなかったので
「ここに相関が出てるじゃねぇか (w」と
指摘したら取締役兼部長に嫌われて
首馘(くび)になった。

別の会社で、「論文どうしの相関に基いて、
類似した論文を検索したい」という要求が
(特に名を秘す、某)日本産婦人学会(仮名。
実在する学会等とは関係ありません)と
(特に名を秘す、某)日本脊椎脊髄病学会(仮名。
実在する学会等とは関係ありません)
から「なんとかならんか?」という話があって、
「共起関係に基づく相関について分析すると、
ありもののツールで構築すれば なんとかなりますけど、
シソーラスとか いろいろ作らなきゃいけないので、実工数
ベースで三百万円、エンドユーザを対象に一からアプリケーション
を作るのを商売でやるんだったら、千五百万円くらい貰わないと、
こっちがペイしません」と正直に答えた。

そうしたら、お客さんが「他所でも同じことを言われたが、
向こうは五千万と言ってた」と、ボソッと言ってたという。

その後の経緯については、おれは馘首になったので知らない。
997: 2018/09/17(月)14:49 ID:rTQuL7Ni(17/20) AAS
>>966
> 「立った! クララが立った!」
どこかの動物園で、コビトカバの雌が生まれたので、
名前を公募したところ、ダントツ(「断然トップ」の略)で
「クララ」と命名されたという話がある。

そんなわけで、日本と日本語は、とうぶん大丈夫だと思っている。

「クララのカバッ!」
読み筋は、『アルプスの少女ハイジ』。
998: Maria 2018/09/17(月)15:10 ID:rTQuL7Ni(18/20) AAS
>>282
> (x,y,z)=(主語,述語,目的語)で、出現頻度の多い順に並べる、
> あるいは少ない順に並べる。高頻度のトリプルがやたら多いと
> いうことは、
> 逆に言えば他と似たり寄ったりでつまらないコンテンツである
> 可能性が高い。出現頻度の少ない組み合わせは、オリジナル表現か
> あるいはナンセンス文かのどちらか。
に関してコメントしておくと、これは
(v, s, o, c) =(述語、主格、目的格, 与格)
くらいにしておくのが順当だと思われます。
述語がないと文にならないし、
「れる・られる」が入ってくると、主語と目的語の
交替が起きたりします。
方向格とか到達格とかいうのが あるのか、という問題は
あると思うんですけど、とりあえず、「なくても困らないんじゃないか」
という意見はあります。
999: 2018/09/17(月)17:04 ID:rTQuL7Ni(19/20) AAS
『言語処理学会』とか『計量国語学会』とか、
入会したほうがいいのかなぁ。
いちおう論文のネタになるような話は
いくつかあるんだが。
1000: Maria 2018/09/17(月)17:10 ID:rTQuL7Ni(20/20) AAS
「四段活用 h 行音末尾動詞」は、
h 音の消失によって a/o/u 音が指標になったとか、
形態素解析は(本来は構文解析の手法として知られている)
チャート法で、かなりの精度で行えるとか、
五段活用 n 行音末尾動詞は、「死ぬ」「去(い)ぬ」
以外に見当たらないとか、
「来る」「する」以外に、「言う」「行く」および
「乞う/請う」「問う」という不規則活用動詞(変格
活用動詞)があるとか、いろいろあるんですけどね?
1001
(1): 1001 ID:Thread(1/2) AAS
このスレッドは1000を超えました。
新しいスレッドを立ててください。
life time: 1567日 11時間 30分 32秒
1002
(1): 1002 ID:Thread(2/2) AAS
5ちゃんねるの運営はプレミアム会員の皆さまに支えられています。
運営にご協力お願いいたします。

───────────────────
《プレミアム会員の主な特典》
★ 5ちゃんねる専用ブラウザからの広告除去
★ 5ちゃんねるの過去ログを取得
★ 書き込み規制の緩和
───────────────────

会員登録には個人情報は一切必要ありません。
月300円から匿名でご購入いただけます。

▼ プレミアム会員登録はこちら ▼
外部リンク:premium.5ch.net

▼ 浪人ログインはこちら ▼
外部リンク[php]:login.5ch.net
1-
スレ情報 赤レス抽出 画像レス抽出 歴の未読スレ

ぬこの手 ぬこTOP 0.017s