【統計分析】機械学習・データマイニング26

[過去ﾛｸﾞ] 【統計分析】機械学習・データマイニング26 (1002ﾚｽ)
上下前次 1-新

このｽﾚｯﾄﾞは過去ﾛｸﾞ倉庫に格納されています｡
次ｽﾚ検索歴削→次ｽﾚ栞削→次ｽﾚ過去ﾛｸﾞﾒﾆｭｰ

898: (ﾜｯﾁｮｲ 0f63-bcBw [153.218.137.102]) 2020/01/05(日)07:15 ID:kv6ApXZt0(4/4) AAS
人工知能が2019年センター試験の英語筆記本試験で185点を獲得 2019年11月19日

人工知能プロジェクト「ロボットは東大に入れるか」の一環として、大学入試センター試験の英語筆記科目に挑戦した結果、185点(偏差値64.1)の成績を収めた。

NTTコミュニケーション科学基礎研究所(NTT CS研)ではこのプロジェクトを自然言語処理および知識処理の基礎研究を進めるベンチマークとして捉え、自動解答に関する知見を積み重ねてきた。

近年は深層学習に基づく文書読解技術が進展しており、そのなかの最新技術であるXLNetは、大規模テキストによる事前学習をベースモデルに、問題の性質に合わせた移転学習を施すことで、異なる種類の問題を比較的少量のデータから効率的に解くことを可能にした。

しかし、学習に利用できるデータが大きく不足している問題や、解答に辞書的な情報が不可欠な問題では、十分な精度の解答が得られなかった。
今回NTT CS研は以下の点で改善を施し、過去3年間のセンター本試験/追試験に対して適用した結果、安定して偏差値60以上を達成したという。

不要文除去問題の高精度化
機械学習は正解と不正解のデータの両方を入力して学習するが、文章から不要な文を見つける比較的新しい「不要文除去問題」には適用できない。
というのも、通常の文章には不要な文が含まれておらず、学習に用いるデータを集めることが難しいためだ。このため従来のAIでは、本試験/追試験で15問中6問しか正解できなかった。

そこで、不要文を含まない通常の文章から、文の順序を組み替えて擬似的に不自然な流れを作成することで、大量の不要文除去問題を自動作成する手法を考案。
これにより15問すべて正答できたという。また、過去問や独自作成問題からなるベンチマークデータにおいても、正答率を60%から86%までに高められた。

外部ﾘﾝｸ[html]:pc.watch.impress.co.jp

899: (ﾜｯﾁｮｲ 0f10-qQU+ [153.131.102.129]) 2020/01/05(日)13:14 ID:5vFDsLtv0(1/6) AAS
>>881
ないならつくるのが研究者の課題じゃ無いのかな？

900: (ﾜｯﾁｮｲ 0f10-qQU+ [153.131.102.129]) 2020/01/05(日)13:16 ID:5vFDsLtv0(2/6) AAS
科学って帰納的に仮説を立てて実証することの繰り返しじゃね？
その仮説を立てたりどんな実証方法があるかを考えたりするのにこれまでに判っている事を演繹的に適用して論理展開する
両方の思考が必要だと思う

901: (ﾜｯﾁｮｲ 0f10-qQU+ [153.131.102.129]) 2020/01/05(日)13:17 ID:5vFDsLtv0(3/6) AAS
>>882
時間や空間が絶対的なものではなくて光の速さが絶対的だと言う仮定を元に演繹的に論理展開していったものだと理解している

902: (ﾜｯﾁｮｲ 0f10-qQU+ [153.131.102.129]) 2020/01/05(日)13:19 ID:5vFDsLtv0(4/6) AAS
>>890
あなたはそうかもしれないけど世の中的には
実験で確認されて初めてノーベル賞もらったりしてるけどな
ヒッグス粒子もそうだったし

903: (ﾜｯﾁｮｲ 9bda-UAPS [114.185.50.145]) 2020/01/05(日)13:31 ID:98+Qbn7z0(1/2) AAS
マウント合戦

904(1): (ﾌﾞｰｲﾓ MM7f-nmBI [163.49.211.159]) 2020/01/05(日)13:34 ID:/FsL/PEZM(1) AAS
物理は実験が主だよ
アインシュタインみたいな理論屋は凄いけど実験で確認出来なかったら只の妄想

905: (ﾜｯﾁｮｲ 9bda-UAPS [114.185.50.145]) 2020/01/05(日)13:41 ID:98+Qbn7z0(2/2) AAS
イタチ野郎

906(1): (ﾜｯﾁｮｲ 0f10-qQU+ [153.131.102.129]) 2020/01/05(日)14:55 ID:5vFDsLtv0(5/6) AAS
>>904
湯川博士とか理論物理で進展した領域もあると思う
実験で確認されないとただの仮説だけど

907(1): (ﾜｯﾁｮｲ cb01-uetj [60.86.178.93]) 2020/01/05(日)15:01 ID:Xx30ZH0k0(1) AAS
>>897
(ヾﾉ･∀･`)ﾅｲﾅｲ

大量に話しかけてやれば
そのうち
それっぽい応答するようになる、かもしれない
日本語対応Python3系のコードっていうと
ちょっと古いが、
unmoっていうのがある。
探して読んでインスコして遊んでみれ。

908(2): (ﾜｯﾁｮｲ ef1d-iOMu [143.189.31.12]) 2020/01/05(日)15:38 ID:rjC1FbEm0(1) AAS
ガチ勢はフツーの線形代数じゃなくて、行列の微分が自然に出てくる領域で、
一般相対論とスキルセットで親和性が高かったりする。

909(1): (ﾌﾞｰｲﾓ MMbf-eGyC [49.239.69.93 [上級国民]]) 2020/01/05(日)17:38 ID:qqN6BGPlM(1) AAS
>>906
もちろん理論も大事なんだけど、物理の場合は理論がいくら発展しても実験で確かめられないと意味がないという風潮があるよ
電磁気力、弱い核力、強い核力を統一する大統一理論の有力候補の超対称性理論ってやつも、多分理論としてはかなり綺麗にまとまってるんだと思うけど、超対称性粒子が全然実験で検出されないからなかなか立場的に厳しいみたい
重力まで統一する万物の理論に関しては、例えば超弦理論なんかだと決めるべきパラメータが多すぎて、また実験も惑星規模の加速器を作ったりしなきゃいけないらしく、現実的にこの世界に適合する超弦理論が得られるかというと怪しいみたいで、物理学の仮説として取り扱うのすら反対意見があるらしいよ

910: (ﾜｯﾁｮｲ efab-nmBI [39.111.85.105]) 2020/01/05(日)17:57 ID:ZpTtXk4N0(1) AAS
>>909
風潮じゃなくてニュートン以来の原則が実験ですよ
何故か物理は数式で表せて、しかも美しい数式になるという所から、ここ100年ちょっとは美しさという指標で、理論だけでもドンドン発展させられたのさ

911: (ﾜｯﾁｮｲ efda-37P1 [223.217.162.112]) 2020/01/05(日)18:08 ID:qL+E1kAs0(1/3) AAS
実験検証でのデメリットとしては、実験でよい結果が得られた⇒だから正しい⇒終わり
としてしまう人が発生すること。

たまたま偶然よい結果がでただけの可能性を疑わない人がいるんですよね。

○-○aveなんかはその最たる例ですね

912: (ｱｳｱｳｳｰ Sa0f-qQU+ [106.154.126.11]) 2020/01/05(日)19:11 ID:aadHI+RPa(1) AAS
アニーリング方式は100%最適解が求まる類のものではないんじゃないの？
量子の振る舞いの結果を計算結果とみなすってことだろうし
量子ゲート方式なら論理演算ができるのかもしれないけど

ノイマン型でも誤り訂正とかしないとミスは起きるし
量子ビットも誤り訂正とかの技術が確立されてきたらエラー率が下がるんじゃないかな

913: (ﾜｯﾁｮｲ efda-37P1 [223.217.162.112]) 2020/01/05(日)19:22 ID:qL+E1kAs0(2/3) AAS
＞アニーリング方式は100%最適解が求まる類のものではないんじゃないの？

そのとおり。量子アニーリングで得た結果は最適解である保証はありません。

結果だけ切り取った結果、無駄な投資を生んでしまい、日本の量子コンピュータ検討の邪魔する結果となってしまいました。

914: (ﾜｯﾁｮｲ efda-37P1 [223.217.162.112]) 2020/01/05(日)19:24 ID:qL+E1kAs0(3/3) AAS
外部ﾘﾝｸ[html]:www.itmedia.co.jp

915(1): (ﾜｯﾁｮｲ ab01-FlZP [126.25.131.86]) 2020/01/05(日)19:43 ID:6gmeklwC0(1/2) AAS
全くすれ違いだし
そもそもお前ら実験も理論もどっちもやってねーだろ。。

916(2): (ﾜｯﾁｮｲ 0f10-qQU+ [153.131.102.129]) 2020/01/05(日)20:06 ID:5vFDsLtv0(6/6) AAS
組合せ最適化問題を解ければ判別問題の学習結果を
より早くより正確に得られるようになるんじゃね？

917(1): (ｽｯｯﾌﾟ Sdbf-37P1 [49.98.159.214]) 2020/01/05(日)20:07 ID:y5M6+8m0d(1/2) AAS
元々の話題の一例を語ってるだけに見えますが…

>>915は帰納法・演繹法何れで仕事をされているかたですか？

918: (ｽｯｯﾌﾟ Sdbf-37P1 [49.98.159.214]) 2020/01/05(日)20:08 ID:y5M6+8m0d(2/2) AAS
>>916
それ以上はスレ違いですね

919: (ﾜｯﾁｮｲ ab01-FlZP [126.25.131.86]) 2020/01/05(日)20:49 ID:6gmeklwC0(2/2) AAS
>>916
そっちのが難しいっつーの。
>>917
両方だよ。どっちかだけで仕事になると思ってのかおめでてーな。

920: (ﾜｯﾁｮｲ ab27-eg9S [164.70.253.210]) 2020/01/05(日)21:17 ID:+jir1/5X0(3/3) AAS
>>907
ありがとうございます！

921: (ﾜｯﾁｮｲ 0f63-bcBw [153.218.137.102]) 2020/01/06(月)06:54 ID:KyZp9b9y0(1) AAS
いよいよ人間超え、AI最新事情文章読解でもAIがついに人間超え、グーグルの「BERT」発表から1年で急成長
2019/11/13

文章読解でもAIがついに人間超え、グーグルの「BERT」発表から1年で急成長

かつてはディープラーニング（深層学習）の適用が難しいと言われていた自然言語処理の分野でも、人工知能（AI）が人間の認識精度を上回るようになった。

グーグルが2018年10月に発表したBERTは、文章の「言語らしさ」を予測する言語モデルを「Transformer」というニューラルネットワークを多段に重ねて実装したものである。
言語らしさの予測は、AIが単語や文章を理解したり自然な文章を生成したりするうえで必要不可欠な要素である。

言語モデルの応用先としては、機械翻訳や機械読解、質問応答、言葉の言い換え（換言）、表現が異なる2つの文章の意味が同じかどうかの判断（含意関係認識）などがある。
グーグルのBERTは自然言語処理の世界に衝撃を与え、論文の発表からわずか1年で2200件以上も他の論文に引用されるほどになった。
これは、BERTが応用に関するベンチマークで人間の精度を上回る成果を上げたからだ。

文章読解のスコアで人間超え

具体的には機械読解のベンチマークである「SQuAD 1.1」で人間の精度を上回った。
SQuAD 1.1は米スタンフォード大学が作ったベンチマークで、「Wikipedia」の中にある140単語ほどの文章を読み解かせて、その文章に関する質問に回答させる。
正答は元の文章の中にフレーズとして存在する。正答の部分を正しく抜き出せるかどうかがポイントとなる。

SQuAD 1.1はタスクとして単純すぎるという指摘もある。
SQuAD 1.1よりタスクの難易度が高いベンチマークは「SQuAD 2.0」や「GLUE」など他にもあり、そうしたより難しいベンチマークではBERTは人間を上回れなかった。
しかしBERTが一部でも人間をスコアで上回ったことから、この分野の研究が一気に加速し、今ではBERTを改善した手法が、より難しいベンチマークでも人間超えを果たすようになった。

外部ﾘﾝｸ:tech.nikkeibp.co.jp

922: (ﾜｯﾁｮｲ 3bdd-BJMr [122.249.73.11]) 2020/01/06(月)16:22 ID:7M4Z0nKv0(1) AAS
この手のテストに和文が無いからいまいちよくわからん

923: (ﾜｯﾁｮｲ 6b54-hZl1 [180.235.0.69]) 2020/01/06(月)19:21 ID:SSsR6M4H0(1) AAS
MSRの連中が描いた本（pdf）だってさ

Foundations of Data Science
外部ﾘﾝｸ[pdf]:www.cs.cornell.edu

日本の研究者はなーんもしない

924(1): (ｱｳｳｨﾌ FF0f-p4uH [106.171.87.46]) 2020/01/07(火)15:50 ID:2Dq0zKSWF(1) AAS
>>868
1 + 1 は 2 にはならんよ
大抵の場合 2 未満で 1.5 とか 1.0 とか
酷い時には 1 未満になることの方が多い

925: (ﾜｯﾁｮｲ 4f7c-I5PR [113.32.86.138]) 2020/01/07(火)16:00 ID:8esPW0SX0(1) AAS
>>908
<・∇・>ニダ

926: (ﾜｯﾁｮｲ 5bda-2fhw [223.217.162.112]) 2020/01/08(水)03:38 ID:LHUjt0c20(1/2) AAS
>>924は>>870-871を嫁

927: (ﾜｯﾁｮｲ 5bda-2fhw [223.217.162.112]) 2020/01/08(水)04:04 ID:LHUjt0c20(2/2) AAS
>>908
ガチ勢は一般相対性理論なんて言わない。ゲージ曲率かファイバー束における写像の捻れで語る

上下前次 1-新書関写板覧索設栞歴

あと 75 ﾚｽあります
ｽﾚ情報赤ﾚｽ抽出画像ﾚｽ抽出歴の未読ｽﾚ

ぬこの手ぬこTOP 0.011s