[過去ログ] 現代数学の系譜 古典ガロア理論を読む35 [無断転載禁止]©2ch.net (667レス)
上下前次1-新
抽出解除 レス栞
このスレッドは過去ログ倉庫に格納されています。
次スレ検索 歴削→次スレ 栞削→次スレ 過去ログメニュー
リロード規制です。10分ほどで解除するので、他のブラウザへ避難してください。
485(1): 現代数学の系譜 古典ガロア理論を読む 2017/07/06(木)17:47 ID:qgJA+Zd6(21/32)調 AAS
>>483-484 補足
従来の式:dsig = eval_winrate - teacher_winrate;
elmoの改良式:dsig = (eval_winrate -t) + 0.5 * (eval_winrate - teacher_winrate);
なにがどう改良されたのか、理屈抜きで、ともかくも、elmoは優勝した。下馬評は、圧倒的にポナンザ有利だったのに
で、それで良しと思ってしまうのが、工学系かもね
だが、「0.5にどんな数学的意味があるのか?」、「0.5は理論的にベストなのか?」、「式の形がなぜこうなるのか?」を、数学者なら掘り下げるのかも知れない・・(^^
https://ja.wikipedia.org/wiki/Elmo_(%E3%82%B3%E3%83%B3%E3%83%94%E3%83%A5%E3%83%BC%E3%82%BF%E5%B0%86%E6%A3%8B%E3%82%BD%E3%83%95%E3%83%88)
elmo (コンピュータ将棋ソフト)
(抜粋)
elmo(エルモ)は、コンピュータ将棋のプログラム。評価関数と定跡が公開されている[1]。
概要
開発者は瀧澤誠。自身は全く将棋を指さない。第27回世界コンピュータ将棋選手権で優勝。初出場の第26回世界コンピュータ将棋選手権は1次予選敗退だった。
elmoは、過去の電王戦でも活躍した強豪AI「Apery」「やねうら王」がベース。elmo同士の対戦を重ねてどのような手を指すと勝率が高いかを調べ、そうした手を選び出せるように評価関数(形勢判断をする際の指標)を調整。その工夫の結果、より正確な形勢判断ができるようになった[2]。
名前の由来はまだまだ強くなるという意味でelectric monkey(電気で動くサル)略してelmoと最初考えていたが、elastic monkey(弾力的な感じ、めげない等の意味)略してelmoに変えると作者の瀧澤は言っている[3]。
脚注
1^ 樽井 秀人 (2017年5月11日). “第27回 世界コンピュータ将棋選手権は新星「elmo」が制覇! 〜評価関数と定跡が公開”. やじうまの杜. 2017年5月12日閲覧。 http://forest.watch.impress.co.jp/docs/serial/yajiuma/1058898.html
(引用終り)
496: 現代数学の系譜 古典ガロア理論を読む 2017/07/06(木)20:07 ID:qgJA+Zd6(24/32)調 AAS
>>486-487
> 4.こういうものは『客観的と言える』のか。
>という様な事は、ごく自然に気になりますが。
>そしてその内部の評価関数として「違うモノを使う」として、AI1とAI2を構成した時、
>これらに無限時間の学習をさせたとして、ではその収束先は『同じにナル』のか否か?
¥さん、どうも。スレ主です。
>>484-485の話は、将棋みたいなある意味単純(例えば、9x9のマス目で、コマ数 20x2(=40)、平均約100手で決着)な、対象ですから・・
それに、白黒というか、善し悪し(勝ち負け)がはっきり出る話
で、ここから出発して、自然言語とかいろいろな社会の出来事への応用(電話のAI自動応答など)
でも、自然言語になると、将棋などと異なり、良否の判断も将棋ほどはっきりしないし
まだまだ、これからですよね
それはそうと、elmoの面白さは、優勝候補のPonanzaが、
「クラウドサービス「高火力コンピューティング」によるCPU1092Core(Intel Xeon)、GPU128基(NVIDIA Titan X)をハードウェアとして揃え、開発陣も合計10人まで増え」
「プリファード・ネットワークス社のライブラリ「Chainer」を利用してディープラーニングを導入」
とかやったけど、それをひっくり返したのが”優勝したelmoがもたらしたのは、たった一行の革命だった”>>483ってところ
まだまだ、AI黎明期ですよね(^^
https://ja.wikipedia.org/wiki/Ponanza
ponanza
(抜粋)
ponanza[注 1](ポナンザ)は、コンピュータ将棋のソフトウェアである。
2017年の第27回世界コンピュータ将棋選手権では、プリファード・ネットワークス社のライブラリ「Chainer」を利用してディープラーニングを導入した 「Ponanza Chainer[1]」としてエントリーし、
さくらインターネットのクラウドサービス「高火力コンピューティング」によるCPU1092Core(Intel Xeon)、GPU128基(NVIDIA Titan X)をハードウェアとして揃え、開発陣も合計10人まで増えた。
この大会では優勝したelmoに二次予選と決勝で2戦して2敗し準優勝に終わり、連覇も止まった。
上下前次1-新書関写板覧索設栞歴
スレ情報 赤レス抽出 画像レス抽出 歴の未読スレ AAサムネイル
ぬこの手 ぬこTOP 0.039s