[過去ログ]
自然言語処理スレッド その5 (1002レス)
自然言語処理スレッド その5 http://mevius.5ch.net/test/read.cgi/tech/1537152490/
上
下
前
次
1-
新
通常表示
512バイト分割
レス栞
このスレッドは過去ログ倉庫に格納されています。
次スレ検索
歴削→次スレ
栞削→次スレ
過去ログメニュー
1: Mr.Moto [nsb14421@nifty.com] 2018/09/17(月) 11:48:10 ID:rTQuL7Ni このスレッドでは、おもに日本語の構文解析・談話理解・情報検索・ 文章生成などの、実装とそれに付帯する技術および理論について 扱いたいと思っています。 http://mevius.5ch.net/test/read.cgi/tech/1537152490/1
2: デフォルトの名無しさん [] 2018/09/17(月) 11:54:05 ID:A092NKhG 977 デフォルトの名無しさん 2018/09/17(月) 07:24:42.74 ID:C7pw6n1T 自然言語処理の知識はゼロなのでわからないです。面白いアイデアだと思うので、Twitterの自然言語処理が専門の方々に聞いてみては? https://peing.net/ja/q/417c9e29-35de-4c95-8323-afd6a50fcbc7 コンピューターのための自然言語理解シミュレ ーターというのは可能ですか? 例えば第二次大戦の推移について、言葉ではな くて動画で理解する方法もあります。 言葉で説明するよりもマインクラフトのような 創作ゲーム表現に変えたほうが分かりやすいで す。 けれども自分が読み漁った人工知能や自然言語 処理の本にはそうしたアプローチは見つからな かったです。 言語はただの記号の羅列で機械は現実世界を全 く知らない。でもそういうことなら、 テレビゲームのような仮想世界をインプットし て、自然言語で操作したらいいと思います。 というか自然言語入力でときめきメモリアルみ たいなゲームをやってみたいてす。 http://mevius.5ch.net/test/read.cgi/tech/1537152490/2
3: デフォルトの名無しさん [] 2018/09/17(月) 11:56:29 ID:A092NKhG 978 デフォルトの名無しさん 2018/09/17(月) 07:27:25.16 ID:C7pw6n1T 教育重視のシナリオの場合は、AI の脳が正しく正確なデータに基づいて学習することを確実にしつつも、 技術の成功と安全性のために はセンサー情報が不可欠です。AirSim を AI 実験、ディープ ラーニング、 強化学習用のためのツールとして改変させ続けることが、本研究プ ロジェクトにおける Microsoft の狙いです。 人工知能がエキサイティングに進化する時代に突入しました。ツールと技術が一 般化して不可能なことも すぐに可能となるでしょう。アンリアル エンジンを使って多種多様な設計およびリサーチ業界全体で AI 開発と教育 アプローチを可能にすることで、次世代の人工知能の進化において解き放たれる潜在的な進歩の 大きなレベルがあります。次世代に向けて人工 知能はとてつもなく大きな進歩が期待できます。 2018.4.13 バーチャル シミュレーションを活用してアンリアル エンジンで AI を教育する https://www.unrealengine.com/ja/blog/ai-in-unreal-engine-learning-through-virtual-simulations http://mevius.5ch.net/test/read.cgi/tech/1537152490/3
4: デフォルトの名無しさん [] 2018/09/17(月) 12:00:52 ID:A092NKhG 410 デフォルトの名無しさん 2016/11/30(水) 12:21:41.26 ID:a3BI0E5E 五文型 S+V (x,y,z)=(S,V,0) S+V+C (Cは正) (x,y,z)=(S,V,C) S+V+O (Oは負) (x,y,z)=(S,V,O) S+V+O+O (Z1は負 Z2は負) (x,y,z)=(S,V,α) α=Z1 α=Z2 S+V+O+C (Z3は負 Z4は正) (x,y,z)=(S,V,β) β=Z3 β=Z4 http://www.eibunpou.net/01/chapter3/3_1.html 五文型を (x,y,z)空間上で表現できないだろうか? http://mevius.5ch.net/test/read.cgi/tech/1537152490/4
5: デフォルトの名無しさん [] 2018/09/17(月) 12:02:58 ID:A092NKhG 487 デフォルトの名無しさん 2018/03/24(土) 22:55:30.16 ID:6mZ6T11K ところで「チンボがシコシコする」という日本語表現は、文法的に正しいのか? チンボ「を」シコシコするのではなくて、チンボ「が」シコシコする。この場合、「チンボ」は主語となる。 オブジェクト指向で言う「集約」は2種類あって、全体(俺)と部分(チンボ)が繋がっている場合と、 全体(俺)と部分(チンボ)が別々になっている場合とが考えられる。けれども「チンボ」はそれ自体 が独立した生き物であり、所有者の意思とは無関係に、勃起して「シコシコする」。 例えば寝てる時にエロい夢みて朝起きてみたらチンコが勃起して射精してたとか。 違うか? 「頭がズキズキする」は良いが、「チンボがシコシコする」はダメな理由を、50字以内で述べろ! http://mevius.5ch.net/test/read.cgi/tech/1537152490/5
6: デフォルトの名無しさん [] 2018/09/17(月) 12:07:07 ID:A092NKhG 683 Mr.Moto sage 2018/08/12(日) 12:47:07.64 ID:ULAI4zx4 >>682 ようやく解ってきた。 述語にかかる句には、 「文法格をもつ句」(主語とか目的語とか)と、 「修飾句」(「さっぱり」「あっさり」「粛々と」)と、 「相」(「夏に」「谷川岳で」)があるという分類が 立っているのだが、いわゆる「具格」は、文法格ではなくて 相であり、体言が述語にかかるときに「で」が附属するので あって、「で」は「具格を表す格助詞」ではないっちゅー コトなんだな? 文法格がないんで、述語に対する一意性もないわけで、 「〜で〜で」みたいなのもアリ(なかなか実例が 示せないんだが)なんだと思う。 「鶏は鍋でおろし醤油で食うのが好きだ」の場合、 「鍋」と「おろし醤油」が助詞「で」によって 述語「食う」に係っているわけで、これを 「鶏は鍋と おろし醤油で食うのが好きだ」とすると 語感がおかしくなる。そう考えると、 「方法」というのは、「場所」や「時刻」「季節」と 同じように、「相」であると考えたほうが、 動詞の型分けがすっきりしそうだ。 http://mevius.5ch.net/test/read.cgi/tech/1537152490/6
7: デフォルトの名無しさん [] 2018/09/17(月) 12:10:53 ID:A092NKhG 765 Mr.Moto sage 2018/09/08(土) 05:36:05.10 ID:Hj3WpMqo ちょっと余談になるけど、「カタストロフィ理論」で 有名な数学者のルネ・トムという人は、この「述語(verb)」 のことを「原始文章」と呼んでいて、そこからさらに踏み込んで 「初等カタストロフィ集合に “切断” という操作を行なうことで、 原始文章のタイプ分けができる」とまで言ってる。で、日本の 自然言語処理の草分けである長尾真先生が、論文のタイトルの 構文構造を型分けしていったら、やっぱり十いくつかの型に 分類できちゃった、ということを仰っている。 http://mevius.5ch.net/test/read.cgi/tech/1537152490/7
8: デフォルトの名無しさん [] 2018/09/17(月) 12:11:45 ID:gugQsnjF 770 Mr.Moto sage 2018/09/08(土) 06:22:14.14 ID:Hj3WpMqo >>763 > 文生成の話 文生成の場合は、 「〔引き続く動詞が要求する格を持った体言列(助詞つき)〕 +〔動詞(連体形)〕〔まだ使ってない格を持った体言〕」 の形で接続してゆけば文(単文または複文)が生成できて、 〔前置詞〕+〔文〕+〔終助詞〕とするか、 〔前置詞〕+〔文〕+〔接続助詞〕+〔文〕…… と するとかして(同時に前置詞のかわりに接続詞を 使うとかして)、文を生成してゆくと、一応の文生成はできる。 ただし、時刻とか場所とか方法とかといった「格を持たない体言」 (これを、個人的に「相」と呼んでいる)とか、「さっぱり」「めっきり」 のような連用修飾詞(動詞・形容詞の連用形もここに含めちゃっていい) とかも適宜織り交ぜると、より「それっぽい」文章が生成できる。 http://mevius.5ch.net/test/read.cgi/tech/1537152490/8
9: デフォルトの名無しさん [] 2018/09/17(月) 12:12:49 ID:A092NKhG 776 Mr.Moto sage 2018/09/08(土) 08:57:47.30 ID:Hj3WpMqo 「もの」という言葉が出たついでに言っておくと、 ここでいう「もの」は“individual”、すなわち「不可分なもの。 個人、個体、個物」を意味する。れっきとした哲学用語だ。 ただし、これは「物理的な存在」ではなく、「概念」を 指していて、しかも「具体的な意味」「内包的な意味」を 持たない。その意味で、individual は「意味を引っ掛ける釘」の ようなもので、「こっちの釘とあっちの釘は、どこがどう違うと 言われても説明できない。ただ、引っかかっている意味が違うし、 比較によって区別できる」ものである。 同じような性質をもった存在として、Codd のデータベース理論における データベース・キーというものがある。 http://mevius.5ch.net/test/read.cgi/tech/1537152490/9
10: デフォルトの名無しさん [] 2018/09/17(月) 12:14:14 ID:gugQsnjF 794 Maria sage 2018/09/09(日) 08:14:33.32 ID:SSGV4TJO >>789 でも述べられていますが、 形態素解析から構文解析に至る過程で、 「語順と省略」に関する問題があります。 ただ、この点に関して、自然言語処理 (日本語処理)の研究者は、ほとんど注意を 払っていません。たとえば、 「象は鼻が長い」は、「象は長い鼻の動物だ」と 同義である、とわれわれは考えていますが、「鼻」 強調された結果として語順が変わり、「動物だ」が 省略され、「象は動物の一種である」という「常識」が 要求されています。 にもかかわらず、形態素レベルの「象は」「鼻が」「長い」に 関してしか議論されていないのが、自然言語処理の停滞の 大きな原因だとわれわれは考えています。 http://mevius.5ch.net/test/read.cgi/tech/1537152490/10
11: デフォルトの名無しさん [] 2018/09/17(月) 12:17:18 ID:gugQsnjF 456 デフォルトの名無しさん 2017/05/23(火) 05:12:53.15 ID:BN0kPFXk 確率の問題はまだ当分無理と思われる。一度には読み込めないからまず小さな文節に区切って、 何が何のことを指しているのかを把握しなければならない。 コンピューターの画面に、(※※) 記号○と×のいずれかを(記号〇と記号×は2つに一つで「背反」である) 表示させる(※) 操作をくり返し行う。(k回繰り返す) ↓ このとき、(どんな時?) 各操作で、(「記号○と×のいずれかを」「表示させる操作」を「k回繰り返す」。) 直前の記号と(「k回の各操作」において) 同じ記号を(○か×か) 続けて表示する確率は、(・・・○〇・・・または・・・××・・・) それまでの過程に(k回の各操作全てにおいて) 関係なく、(一定である) pであるとする。(確率は0<p<1) ↓ 最初に、(k=1において) コンピュータの画面に(※※) 記号×が 表示された。(※) 操作をくり返し行い、(k回繰り返す) 記号×が 最初のものも含めて(k=1のものも含めて) 3個出る(×・・・×・・・×、×××、××・・・×、×・・・××) よりも前に(×・・・×・・・、××、××・・・、×・・・×)、 記号○がn個出る確率をPnとする。 http://math.nakaken88.com/problem/tokyo-u-r-2006-2/ http://mevius.5ch.net/test/read.cgi/tech/1537152490/11
12: デフォルトの名無しさん [] 2018/09/17(月) 12:18:37 ID:A092NKhG 908 Maria sage 2018/09/14(金) 06:37:42.37 ID:BVvdIn+z >>900 リンク先の内容に関して、「が」や「と」や「も」には、 多少の注意が必要です。 とりたて詞の「が」と逆説の接続助詞「が」を 間違える人はあまりいませんが、「のが」が 省略されて「が」になることがあります ex.「ここで遭ったが百年目」。 並列の「と」(「天と地と」)と因果関係の 「と」(「林檎を齧ると歯茎から血がでませんか?」)。 後者は接続詞「すると」と機能は同じ。 助詞「も」(「瑠璃も玻璃も磨けば光る」)と 接続助詞「も」(「そうは言っても」)。 まぁ、前に来る動詞の活用でだいたい判断 できますけどね。 http://mevius.5ch.net/test/read.cgi/tech/1537152490/12
13: デフォルトの名無しさん [] 2018/09/17(月) 12:21:16 ID:gugQsnjF 986 デフォルトの名無しさん sage 2018/09/17(月) 09:08:02.28 ID:rTQuL7Ni >>984 > y=9.8x(m/秒)の解釈が『1秒ごとに秒速9.8メートルづつ > 速度が上がる』という 物理を齧った奴だったら、「v=gt (SI 単位系。g ≒ 9.80665 m/sec^2)」 と書いてほしいだろうし、一目見て「真空中の自由落下だろうけど、 どのくらいの規模と精度を考えてるんだろうか?」と考えるだろう。 コンピュータに物理学や力学のセンスを持たせるためにも、 「われわれ人間にとっての “自明性” の正体ってなんだろう?」という 点について掘り下げる必要があると思う。おれなんかは高機能自閉だから、 そういう意味では人生のうちの多くを「自分の行動を妨げる壁」としての 「自明性との闘い」に費やしているので、自然言語処理の研究者に 向いてるっちゃあ向いてると思っているが。 http://mevius.5ch.net/test/read.cgi/tech/1537152490/13
14: デフォルトの名無しさん [] 2018/09/17(月) 12:22:35 ID:A092NKhG 137 デフォルトの名無しさん 2014/11/03(月) 08:35:06.90 ID:gGej6kOp (1)今年は3パーセント物価が上昇し、来年は5パーセント物価が上昇するという。平均の予想物価上昇率はいくつか。 (2)今年は3パーセント物価が上昇するという人と、5パーセント上昇するという人がいる。平均の予想物価上昇率はいくつか。 <ロボットは東大に入れるか 新井紀子> 「今年は〜」 ? 西暦○年度(現在)2) ? 去年は、来年は、○年前は、○年後は〜(1) ? うるう年だ 「物価が上昇」 ? どの月間に、どの年間に(1)、何%の割合か(1)(2) ? 品目別には〜、○円上昇、○円下落 「〜という人」 ? 〜という名前の人間が居る(人間A、人間B) ? 人間Aは○○と述べた、人間Bは△△と述べた(2) 機械には連想思考は期待できない以上、徹頭徹尾人力でインプットあるのみ。 http://mevius.5ch.net/test/read.cgi/tech/1537152490/14
15: デフォルトの名無しさん [] 2018/09/17(月) 12:23:33 ID:gugQsnjF 143 デフォルトの名無しさん 2014/11/03(月) 23:09:51.81 ID:tokfpTJi 初頭幾何は、不要な線を消して、必要な線だけにしないと、定理が使えない。 元の図形 http://livedoor.blogimg.jp/mikamikanmikamikan/imgs/3/a/3aaa1e5f.jpg 単純化して、2QT=QR http://livedoor.blogimg.jp/mikamikanmikamikan/imgs/0/1/01eaff32.jpg 線分QTと線分QRの関係を求めるのに、どの線が必要で、どの線が不要なのか。 また必要な線が無い場合は、点と点同士を結んだり線分を延長させたりして、補助線を引く。 計算力にモノを言わせて、しらみつぶしに全ての場合を調べつくすというやり方もある。 正九角形があり辺を共有しない三角形はいくつあるか。という問題があり、答えは30らしいです。なぜこうなるのでしょうか? http://detail.chiebukuro.yahoo.co.jp/qa/question_detail/q10114300645 全ての場合をしらみつぶしに数え上げるアルゴリズムは可能ですか? http://mevius.5ch.net/test/read.cgi/tech/1537152490/15
16: デフォルトの名無しさん [sage] 2018/09/17(月) 17:36:51 ID:rTQuL7Ni なんか、前スレを埋めているうちに、 いろいろエントリが上がってるんだけど、 これはどう解釈したらいいのかな? ついでに古いネタをひとつ。 木村秀政先生に、ある人が質問したそうです。 「“絶対に” 落ちない飛行機を作ることは可能ですか?」 「もちろん可能です」 と、木村先生は真顔で答えました。 「ただし、飛びませんけどね」 http://mevius.5ch.net/test/read.cgi/tech/1537152490/16
17: デフォルトの名無しさん [sage] 2018/09/17(月) 18:50:37 ID:rTQuL7Ni >>15 > 正九角形があり辺を共有しない三角形はいくつあるか。 > という問題があり、答えは30らしいです。なぜこうなるのでしょうか? 自然言語処理スレッドに書くということは、 原文を入力して、これを > 「正九角形があります。『元の正九角形と、辺を共有しない三角形』は > いくつあるか?」 という問題があり、答えは30らしいです。 > なぜこうなるのでしょうか? だと解釈したうえで、人間に対して「なぜこうなるのか?」を 理解させるような出力しろ、という話なわけですよね? わかりません(笑)。 > 全ての場合をしらみつぶしに数え上げる > アルゴリズムは可能ですか? 「アルゴリズム」というと、「実行順序が確定している」 という条件が入るのですが、チャート法は、その条件を 満たしていないので、「アルゴリズム」に含めない 流儀と「広い意味での『アルゴリズム』」と捉える 流儀があります。後者の意味ですと、形態素解析システムを 使って、実装することは可能です。「隣の点を避けて、二つの 相異なる点を経由して、元の点に戻る」ルートをすべての(九つの) 点について求めればいいのですから。 ただ、適切な「文法」を定義しないと、右回りと左回りを別物として 解析してしまうので、答えが「60通り」になってしまうかも しれませんが。 http://mevius.5ch.net/test/read.cgi/tech/1537152490/17
18: デフォルトの名無しさん [sage] 2018/09/17(月) 19:02:31 ID:rTQuL7Ni >>14 > (2)今年は3パーセント物価が上昇するという人と、 > 5パーセント上昇するという人がいる。 > 平均の予想物価上昇率はいくつか。 わからない。母集団が不明であり、サンプリングが偏っている 可能性を排除できないから。 今年は3パーセント物価が上昇するというユダヤ人と、 5パーセント上昇するというユダヤ人がいたとする。 平均的なドイツ人の予想物価上昇率は十万%かもしれない。 http://mevius.5ch.net/test/read.cgi/tech/1537152490/18
19: デフォルトの名無しさん [sage] 2018/09/17(月) 20:05:38 ID:rTQuL7Ni 言語処理学会は一九九四年設立、 年会費八千円で、事務局は京都、 会誌は年四回発行で、総会は年一回だそうだ。 学会誌だけでも累計百冊程度というと、 チェックするだけでも大変だなぁ …… http://mevius.5ch.net/test/read.cgi/tech/1537152490/19
20: デフォルトの名無しさん [sage] 2018/09/17(月) 20:13:27 ID:rTQuL7Ni 計量国語学会は年会費五千五百円で、 事務局は東京、会誌は年四回発行で、 現在三十一号まで出ているらしい。 東工大の奥村・高村研究室とも関連が あるらしい。 こっちの方が近くて安そうだし、 研究室とも関係してそうなので、 ちょっと調べてみようかと思う。 http://mevius.5ch.net/test/read.cgi/tech/1537152490/20
上
下
前
次
1-
新
書
関
写
板
覧
索
設
栞
歴
あと 982 レスあります
スレ情報
赤レス抽出
画像レス抽出
歴の未読スレ
AAサムネイル
Google検索
Wikipedia
ぬこの手
ぬこTOP
0.011s