[過去ログ] 【統計分析】機械学習・データマイニング26 (1002レス)
1-

このスレッドは過去ログ倉庫に格納されています。
次スレ検索 歴削→次スレ 栞削→次スレ 過去ログメニュー
898: (ワッチョイ 0f63-bcBw [153.218.137.102]) 2020/01/05(日)07:15 ID:kv6ApXZt0(4/4) AAS
人工知能が2019年センター試験の英語筆記本試験で185点を獲得 2019年11月19日

人工知能プロジェクト「ロボットは東大に入れるか」の一環として、大学入試センター試験の英語筆記科目に挑戦した結果、185点(偏差値64.1)の成績を収めた。

NTTコミュニケーション科学基礎研究所(NTT CS研)ではこのプロジェクトを自然言語処理および知識処理の基礎研究を進めるベンチマークとして捉え、自動解答に関する知見を積み重ねてきた。

近年は深層学習に基づく文書読解技術が進展しており、そのなかの最新技術であるXLNetは、大規模テキストによる事前学習をベースモデルに、問題の性質に合わせた移転学習を施すことで、異なる種類の問題を比較的少量のデータから効率的に解くことを可能にした。

しかし、学習に利用できるデータが大きく不足している問題や、解答に辞書的な情報が不可欠な問題では、十分な精度の解答が得られなかった。
今回NTT CS研は以下の点で改善を施し、過去3年間のセンター本試験/追試験に対して適用した結果、安定して偏差値60以上を達成したという。

不要文除去問題の高精度化
機械学習は正解と不正解のデータの両方を入力して学習するが、文章から不要な文を見つける比較的新しい「不要文除去問題」には適用できない。
というのも、通常の文章には不要な文が含まれておらず、学習に用いるデータを集めることが難しいためだ。このため従来のAIでは、本試験/追試験で15問中6問しか正解できなかった。

そこで、不要文を含まない通常の文章から、文の順序を組み替えて擬似的に不自然な流れを作成することで、大量の不要文除去問題を自動作成する手法を考案。
これにより15問すべて正答できたという。また、過去問や独自作成問題からなるベンチマークデータにおいても、正答率を60%から86%までに高められた。

外部リンク[html]:pc.watch.impress.co.jp
899: (ワッチョイ 0f10-qQU+ [153.131.102.129]) 2020/01/05(日)13:14 ID:5vFDsLtv0(1/6) AAS
>>881
ないならつくるのが研究者の課題じゃ無いのかな?
900: (ワッチョイ 0f10-qQU+ [153.131.102.129]) 2020/01/05(日)13:16 ID:5vFDsLtv0(2/6) AAS
科学って帰納的に仮説を立てて実証することの繰り返しじゃね?
その仮説を立てたりどんな実証方法があるかを考えたりするのにこれまでに判っている事を演繹的に適用して論理展開する
両方の思考が必要だと思う
901: (ワッチョイ 0f10-qQU+ [153.131.102.129]) 2020/01/05(日)13:17 ID:5vFDsLtv0(3/6) AAS
>>882
時間や空間が絶対的なものではなくて光の速さが絶対的だと言う仮定を元に演繹的に論理展開していったものだと理解している
902: (ワッチョイ 0f10-qQU+ [153.131.102.129]) 2020/01/05(日)13:19 ID:5vFDsLtv0(4/6) AAS
>>890
あなたはそうかもしれないけど世の中的には
実験で確認されて初めてノーベル賞もらったりしてるけどな
ヒッグス粒子もそうだったし
903: (ワッチョイ 9bda-UAPS [114.185.50.145]) 2020/01/05(日)13:31 ID:98+Qbn7z0(1/2) AAS
マウント合戦
904
(1): (ブーイモ MM7f-nmBI [163.49.211.159]) 2020/01/05(日)13:34 ID:/FsL/PEZM(1) AAS
物理は実験が主だよ
アインシュタインみたいな理論屋は凄いけど実験で確認出来なかったら只の妄想
905: (ワッチョイ 9bda-UAPS [114.185.50.145]) 2020/01/05(日)13:41 ID:98+Qbn7z0(2/2) AAS
イタチ野郎
906
(1): (ワッチョイ 0f10-qQU+ [153.131.102.129]) 2020/01/05(日)14:55 ID:5vFDsLtv0(5/6) AAS
>>904
湯川博士とか理論物理で進展した領域もあると思う
実験で確認されないとただの仮説だけど
907
(1): (ワッチョイ cb01-uetj [60.86.178.93]) 2020/01/05(日)15:01 ID:Xx30ZH0k0(1) AAS
>>897
(ヾノ・∀・`)ナイナイ

大量に話しかけてやれば
そのうち
それっぽい応答するようになる、かもしれない
日本語対応Python3系のコードっていうと
ちょっと古いが、
unmoっていうのがある。
探して読んでインスコして遊んでみれ。
908
(2): (ワッチョイ ef1d-iOMu [143.189.31.12]) 2020/01/05(日)15:38 ID:rjC1FbEm0(1) AAS
ガチ勢はフツーの線形代数じゃなくて、行列の微分が自然に出てくる領域で、
一般相対論とスキルセットで親和性が高かったりする。
909
(1): (ブーイモ MMbf-eGyC [49.239.69.93 [上級国民]]) 2020/01/05(日)17:38 ID:qqN6BGPlM(1) AAS
>>906
もちろん理論も大事なんだけど、物理の場合は理論がいくら発展しても実験で確かめられないと意味がないという風潮があるよ
電磁気力、弱い核力、強い核力を統一する大統一理論の有力候補の超対称性理論ってやつも、多分理論としてはかなり綺麗にまとまってるんだと思うけど、超対称性粒子が全然実験で検出されないからなかなか立場的に厳しいみたい
重力まで統一する万物の理論に関しては、例えば超弦理論なんかだと決めるべきパラメータが多すぎて、また実験も惑星規模の加速器を作ったりしなきゃいけないらしく、現実的にこの世界に適合する超弦理論が得られるかというと怪しいみたいで、物理学の仮説として取り扱うのすら反対意見があるらしいよ
910: (ワッチョイ efab-nmBI [39.111.85.105]) 2020/01/05(日)17:57 ID:ZpTtXk4N0(1) AAS
>>909
風潮じゃなくてニュートン以来の原則が実験ですよ
何故か物理は数式で表せて、しかも美しい数式になるという所から、ここ100年ちょっとは美しさという指標で、理論だけでもドンドン発展させられたのさ
911: (ワッチョイ efda-37P1 [223.217.162.112]) 2020/01/05(日)18:08 ID:qL+E1kAs0(1/3) AAS
実験検証でのデメリットとしては、実験でよい結果が得られた⇒だから正しい⇒終わり
としてしまう人が発生すること。

たまたま偶然よい結果がでただけの可能性を疑わない人がいるんですよね。

○-○aveなんかはその最たる例ですね
912: (アウアウウー Sa0f-qQU+ [106.154.126.11]) 2020/01/05(日)19:11 ID:aadHI+RPa(1) AAS
アニーリング方式は100%最適解が求まる類のものではないんじゃないの?
量子の振る舞いの結果を計算結果とみなすってことだろうし
量子ゲート方式なら論理演算ができるのかもしれないけど

ノイマン型でも誤り訂正とかしないとミスは起きるし
量子ビットも誤り訂正とかの技術が確立されてきたらエラー率が下がるんじゃないかな
913: (ワッチョイ efda-37P1 [223.217.162.112]) 2020/01/05(日)19:22 ID:qL+E1kAs0(2/3) AAS
>アニーリング方式は100%最適解が求まる類のものではないんじゃないの?

そのとおり。量子アニーリングで得た結果は最適解である保証はありません。

結果だけ切り取った結果、無駄な投資を生んでしまい、日本の量子コンピュータ検討の邪魔する結果となってしまいました。
914: (ワッチョイ efda-37P1 [223.217.162.112]) 2020/01/05(日)19:24 ID:qL+E1kAs0(3/3) AAS
外部リンク[html]:www.itmedia.co.jp
915
(1): (ワッチョイ ab01-FlZP [126.25.131.86]) 2020/01/05(日)19:43 ID:6gmeklwC0(1/2) AAS
全くすれ違いだし
そもそもお前ら実験も理論もどっちもやってねーだろ。。
916
(2): (ワッチョイ 0f10-qQU+ [153.131.102.129]) 2020/01/05(日)20:06 ID:5vFDsLtv0(6/6) AAS
組合せ最適化問題を解ければ判別問題の学習結果を
より早くより正確に得られるようになるんじゃね?
917
(1): (スッップ Sdbf-37P1 [49.98.159.214]) 2020/01/05(日)20:07 ID:y5M6+8m0d(1/2) AAS
元々の話題の一例を語ってるだけに見えますが…

>>915は帰納法・演繹法何れで仕事をされているかたですか?
918: (スッップ Sdbf-37P1 [49.98.159.214]) 2020/01/05(日)20:08 ID:y5M6+8m0d(2/2) AAS
>>916
それ以上はスレ違いですね
919: (ワッチョイ ab01-FlZP [126.25.131.86]) 2020/01/05(日)20:49 ID:6gmeklwC0(2/2) AAS
>>916
そっちのが難しいっつーの。
>>917
両方だよ。どっちかだけで仕事になると思ってのかおめでてーな。
920: (ワッチョイ ab27-eg9S [164.70.253.210]) 2020/01/05(日)21:17 ID:+jir1/5X0(3/3) AAS
>>907
ありがとうございます!
921: (ワッチョイ 0f63-bcBw [153.218.137.102]) 2020/01/06(月)06:54 ID:KyZp9b9y0(1) AAS
いよいよ人間超え、AI最新事情 文章読解でもAIがついに人間超え、グーグルの「BERT」発表から1年で急成長
2019/11/13

文章読解でもAIがついに人間超え、グーグルの「BERT」発表から1年で急成長

かつてはディープラーニング(深層学習)の適用が難しいと言われていた自然言語処理の分野でも、人工知能(AI)が人間の認識精度を上回るようになった。

グーグルが2018年10月に発表したBERTは、文章の「言語らしさ」を予測する言語モデルを「Transformer」というニューラルネットワークを多段に重ねて実装したものである。
言語らしさの予測は、AIが単語や文章を理解したり自然な文章を生成したりするうえで必要不可欠な要素である。

言語モデルの応用先としては、機械翻訳や機械読解、質問応答、言葉の言い換え(換言)、表現が異なる2つの文章の意味が同じかどうかの判断(含意関係認識)などがある。
グーグルのBERTは自然言語処理の世界に衝撃を与え、論文の発表からわずか1年で2200件以上も他の論文に引用されるほどになった。
これは、BERTが応用に関するベンチマークで人間の精度を上回る成果を上げたからだ。

文章読解のスコアで人間超え

具体的には機械読解のベンチマークである「SQuAD 1.1」で人間の精度を上回った。
SQuAD 1.1は米スタンフォード大学が作ったベンチマークで、「Wikipedia」の中にある140単語ほどの文章を読み解かせて、その文章に関する質問に回答させる。
正答は元の文章の中にフレーズとして存在する。正答の部分を正しく抜き出せるかどうかがポイントとなる。

SQuAD 1.1はタスクとして単純すぎるという指摘もある。
SQuAD 1.1よりタスクの難易度が高いベンチマークは「SQuAD 2.0」や「GLUE」など他にもあり、そうしたより難しいベンチマークではBERTは人間を上回れなかった。
しかしBERTが一部でも人間をスコアで上回ったことから、この分野の研究が一気に加速し、今ではBERTを改善した手法が、より難しいベンチマークでも人間超えを果たすようになった。

外部リンク:tech.nikkeibp.co.jp
922: (ワッチョイ 3bdd-BJMr [122.249.73.11]) 2020/01/06(月)16:22 ID:7M4Z0nKv0(1) AAS
この手のテストに和文が無いからいまいちよくわからん
923: (ワッチョイ 6b54-hZl1 [180.235.0.69]) 2020/01/06(月)19:21 ID:SSsR6M4H0(1) AAS
MSRの連中が描いた本(pdf)だってさ

Foundations of Data Science
外部リンク[pdf]:www.cs.cornell.edu

日本の研究者はなーんもしない
924
(1): (アウウィフ FF0f-p4uH [106.171.87.46]) 2020/01/07(火)15:50 ID:2Dq0zKSWF(1) AAS
>>868
1 + 1 は 2 にはならんよ
大抵の場合 2 未満で 1.5 とか 1.0 とか
酷い時には 1 未満になることの方が多い
925: (ワッチョイ 4f7c-I5PR [113.32.86.138]) 2020/01/07(火)16:00 ID:8esPW0SX0(1) AAS
>>908
<・∇・>ニダ
926: (ワッチョイ 5bda-2fhw [223.217.162.112]) 2020/01/08(水)03:38 ID:LHUjt0c20(1/2) AAS
>>924>>870-871を嫁
927: (ワッチョイ 5bda-2fhw [223.217.162.112]) 2020/01/08(水)04:04 ID:LHUjt0c20(2/2) AAS
>>908
ガチ勢は一般相対性理論なんて言わない。ゲージ曲率かファイバー束における写像の捻れで語る
1-
あと 75 レスあります
スレ情報 赤レス抽出 画像レス抽出 歴の未読スレ

ぬこの手 ぬこTOP 0.011s