[過去ログ]
現代数学の系譜 工学物理雑談 古典ガロア理論も読む44 (704レス)
現代数学の系譜 工学物理雑談 古典ガロア理論も読む44 http://rio2016.5ch.net/test/read.cgi/math/1506848694/
上
下
前次
1-
新
通常表示
512バイト分割
レス栞
抽出解除
レス栞
このスレッドは過去ログ倉庫に格納されています。
次スレ検索
歴削→次スレ
栞削→次スレ
過去ログメニュー
561: 現代数学の系譜 工学物理雑談 古典ガロア理論も読む [sage] 2017/10/20(金) 21:01:52.46 ID:nXsa98Fj >>516 関連 http://www.natureasia.com/ja-jp/research/highlight/12229 【人工知能】全くのゼロから独学で囲碁を習得する「アルファ碁ゼロ」 Nature 2017年10月19日 (抜粋) コンピュータープログラム「アルファ碁」の新バージョンである「アルファ碁ゼロ」は、人間による入力をせず、全くの独学で、古典的な戦略ゲームである囲碁を白紙の状態から急速に習得できることが分かった。 その上アルファ碁ゼロは、旧バージョンのアルファ碁(2016年3月に囲碁チャンピオンのイ・セドルを破った)との対局で100戦100勝の成績を挙げた。この新しいコンピュータープログラムについて報告する論文が、今週掲載される。 DOI:10.1038/nature24270 | 英語の原文 (有料) http://dx.doi.org/10.1038/nature24270 http://rio2016.5ch.net/test/read.cgi/math/1506848694/561
568: 現代数学の系譜 工学物理雑談 古典ガロア理論も読む [sage] 2017/10/20(金) 22:54:46.05 ID:nXsa98Fj >>561 参考 棋譜がダウンロードできて、並べてみたが、面白いね(^^ http://medaka.2ch.net/test/read.cgi/gamestones/1508065320/214 コンピューター囲碁ソフトについて語るスレ52 214 名前:名無し名人[sage] 投稿日:2017/10/19(木) 17:19:24.54 ID:hQ/3Zi4s [1/6] (抜粋) 4. モンテカルロ法(Rollout)は使っていない。 個人的には 4. が衝撃でした。 以下はメモです。 人間がよく打つ隅の定石を見つけた(5つの例)。 33に入る定石は5手目に黒がケイマに飛ぶ形を最終的に好む 学習の初期は石を取ることを好み、次に死活の基礎を学び、最終的にバランスが取れた美しい手を打つ 学習から36時間でセドル戦のバージョンに追いついた。 セドル版には100-0で勝つ。 プロの手の一致率は48%ぐらいと低い。プロの手から学習したものは54%ぐらい。 ResNetが単なるConvolutionより優秀で、PolicyとValueを一つのネットワークで評価するのが優秀。 出力はValueとPolicy。一つのネットワーク。 入力は石の配置と着手履歴(棋譜)。 0から7手前までの黒、白の配置と手番(17面) ResNetを使ってる。Batch Normalizationあり。 40 Residual Block 1 Block は (3x3 256, BN, ReLU)が2つ。つまり 80層のConvolution ZeroはMasterに89勝11敗 MasterはZeroと同じ手法で作られているが、人が作ったRolloutは使っていた。 学習段階ではMCTSを使ってる。 学習の中に先読みを取り入れた、新しい強化学習 -------------------------------------------------------- 自己対戦の棋譜はこちらにあるようです。 AlphaGo Zeroの自己対戦の棋譜 https://www.nature.com/nature/journal/v550/n7676/extref/nature24270-s2.zip http://524.teacup.com/yss/bbs/ http://rio2016.5ch.net/test/read.cgi/math/1506848694/568
582: 現代数学の系譜 工学物理雑談 古典ガロア理論も読む [sage] 2017/10/21(土) 10:03:43.17 ID:nXc5pZQW >>561 >DOI:10.1038/nature24270 | 英語の原文 >(有料) 表から行くと有料だが DeepMindのサイトに、裏口からNature論文のPDFが落とせるね 棋譜もいろいろダウンロードできる グラフとか動画が面白い https://deepmind.com/blog/alphago-zero-learning-scratch/ AlphaGo Zero: Learning from scratch Demis Hassabis David Silver DeepMind Wednesday, 18 October 2017 (抜粋) Read the paper doi:10.1038/nature24270 Nature 2017(3 5 4 | N AT U R E | VO L 5 5 0 | 1 9 o c to b er 2 0 1 7) https://www.nature.com/articles/nature24270.epdf?author_access_token=VJXbVjaSHxFoctQQ4p2k4tRgN0jAjWel9jnR3ZoTv0PVW4gB86EEpGqTRDtpIz-2rmo8-KG06gqVobU5NSCFeHILHcVFUeMsbvwS-lxjqQGg98faovwjxeTUgZAUMnRQ Download AlphaGo Zero games (棋譜) http://www.alphago-games.com/ 以上 http://rio2016.5ch.net/test/read.cgi/math/1506848694/582
メモ帳
(0/65535文字)
上
下
前次
1-
新
書
関
写
板
覧
索
設
栞
歴
スレ情報
赤レス抽出
画像レス抽出
歴の未読スレ
AAサムネイル
Google検索
Wikipedia
ぬこの手
ぬこTOP
0.158s*