[過去ログ] 自然言語処理スレッド その4 (503レス)
上下前次1-新
抽出解除 必死チェッカー(本家) (べ) 自ID レス栞 あぼーん
このスレッドは過去ログ倉庫に格納されています。
次スレ検索 歴削→次スレ 栞削→次スレ 過去ログメニュー
150: 2014/11/06(木)07:15 ID:1dD9kBwW(1/4) AAS
外部リンク[html]:blog.livedoor.jp
>日本語の形式表現変換については,物理科目では極めて困難で,数学のような半自動化さえ難しい。
>日本語が曖昧すぎるため。たとえば「金属を折り曲げる」や「滑らかな坂」を東ロボくんが自力で理解して,
>シミュレーターに取り込むのは,少なくとも現状では絶対に無理。
こういうのは、物理用の形式表現変換コーパスを用意しておきたい。
>金属を折り曲げる
長方形のABCDがある。金属板は一様で、質量はM。金属板をEFとGHでそれぞれ直角に折り曲げて、
水平な床に置きCDの中点Iから軽い糸でおもりをつるす。おもりの質量がある値より大きいと金属板は倒れてしまう
mはどのような値になるか?
外部リンク[html]:okwave.jp
この類題に、「金属板」=「金属でできた板」とアノテーションをつけておけば、「金属を折り曲げる」にも応用できる。
また金属を折り曲げると、支点とモーメントはどうなるかという連想思考も可能になる。
>滑らかな坂
したがって滑らかな坂を転がる質点は運動の方向が斜面の形状によって変わろうとも力学的エネルギーの保存は成り立っている。
外部リンク[pdf]:www.ep.sci.hokudai.ac.jp
全ての文章を完璧に形式表現変換できなくても、過去問の解法パターンからある程度の推論はできる。
入力予測機能を備えた文字変換システムのように、解法予測機能をつける。
151: 2014/11/06(木)13:15 ID:1dD9kBwW(2/4) AAS
外部リンク[pdf]:www.ep.sci.hokudai.ac.jp
>なめらかな面に束縛された質点の運動。
これをどうやってコンピューターに理解させるか、どう形式変換するか。
mv2/2(運動エネルギー) + mgh(位置エネルギー) = 一定、となる物理現象とでも定義しようか。
滑らかな面は不定曲線でもいいということで。これなら風が吹いたり電磁気が出たりで別のエネルギー加減
が生じない限り、公式当てはめで楽に解答できる。
同じ内容の物理現象を、別の言葉で言い換えたり、別のイラスト図で書き換えたりして、形式変換コーパスを増やす。
152: 2014/11/06(木)14:50 ID:1dD9kBwW(3/4) AAS
数学?Aの第5問「104を素因数分解すると〜」ができなかったのは何故かを数学担当者に聞いてみた。
いくら東ロボが語学オンチでも、これはないだろう、と。
画像リンク
前文の「104以下の自然数で,104と互いに素である自然数の個数を求めよう。」に目がくらんで解答できなかったらしい。
余計なノイズ(最初の問いでは)が判断を狂わせたのだ。何がノイズかは、文章の一部を何百回もランダムに抜き出して吟味するしかない。
長文は一文一文を分解して(省略語を補い、かつ「それ」「これ」などの代名詞の内容は明確にした上で)、
例えば一つの大問に10の文章があったら、その中からランダムに一つ(10通り)、ランダムに2つ(10×9÷2=45通り)、
ランダムに3つ(10・9・8÷3・2)・・・というふうに挙げてみる。また一つの文を文節に区切ったり、短い文に書き換えたり、
省略語を補ったり、ランダムにいくつかの文節を切り取ってみたりして、小問ごとに必要な要素だけを抽出する。
画像リンク
数列もからっきしだった。これの最初の問いは、ある条件での等比数列の一般項を求めるというごく初歩的な問い。
いったんノイズを消去して、a2 = 24 , a5 = 192 から r^3 = 8
画像リンク
あとから復活させて、公比は実数だから r = 2 よって
画像リンク
公比=2、かつ a2 = 24 より 初項a1 = 12 、よって数列{an}の一般項は an = 12(2)^(n-1)
画像リンク
あとは東ロボくんお得意の「同値変形」で楽勝のはず。
153(3): 2014/11/06(木)16:11 ID:1dD9kBwW(4/4) AAS
>ブルーベリーがのったデコレーションケーキ(のイラスト)なんて、おそらく多くの人が生まれて初めて見るものでしょうね。
>なのに、われわれはそれがそうだと、正しくわかる。どうしてなのでしょうか。
画像リンク
こうして「ある部分」を削除してしまえば、「何かと何かが交互に楕円形に並んでいる」くらいの認識はできるはずだ。
どのように削除するかは、「境界線」のみに着目して切り分けで、あとはランダムに何万通りも抽出する。
上下前次1-新書関写板覧索設栞歴
スレ情報 赤レス抽出 画像レス抽出 歴の未読スレ
ぬこの手 ぬこTOP 0.101s