[過去ログ]
【オセロ,将棋】ボードゲーム【囲碁,War】 (1002レス)
【オセロ,将棋】ボードゲーム【囲碁,War】 http://mevius.5ch.net/test/read.cgi/gamedev/1057763418/
上
下
前次
1-
新
通常表示
512バイト分割
レス栞
抽出解除
レス栞
このスレッドは過去ログ倉庫に格納されています。
次スレ検索
歴削→次スレ
栞削→次スレ
過去ログメニュー
752: 310 [sage] 2017/03/03(金) 01:05:23.13 ID:0ijSS6CX 次の1手もDCNNもなんか上手くいかないので、アルファ碁の原点に戻りました。 アルファ碁のMTCSとしての特徴は、各ノードで評価関数を動かして、そのノードに 点をつけて勝率と50%混合する事で、ノードの選択に事前に差をつけてしまう事に あります。これによって、負けが多いけど1手だけ良い手があるルートを正しく評価 する可能性を高めていると解釈しています。 で、評価関数はオセロでは線形和で確立されているので、昔の奴をと思ったのですが、 どうせならMLPのライブラリ使ってしまえばEigenが使えるので信頼性高い上に、学習 率の最適化でモーメンタムどころかSMORMS3が使えるようになります。インプットが とても疎なので、EigenのSparseMatrixを使って高速化を図ります。 早速作って学習させてみたところ…僕の記憶が確かなら以前のプログラムの数十倍 くらいの速度で動いています(汗。これなら100エポックくらい楽勝。 今は評価値を計算させていますが、一旦できたら、次のステップで勝率を計算させられ ないかなぁと。ただ、評価値がある程度正確なら、勝率ではなく平均スコアでプレイアウト しても良いのかなと思っています。 http://mevius.5ch.net/test/read.cgi/gamedev/1057763418/752
883: 535 [sage] 2017/07/01(土) 23:24:59.13 ID:A/qufpQM 局所解を避けつつ有望な局面を多く調べるというのはまさにMCTSでやってることなんじゃ? 一回駄目出し食らった案ですが、モンテカルロ木をDBに保存して無限に成長させるという案がどうしても忘れられない。 局面数が大きくなるゲームだと木が大きくなりすぎて駄目ですがConnect4なら… http://mevius.5ch.net/test/read.cgi/gamedev/1057763418/883
メモ帳
(0/65535文字)
上
下
前次
1-
新
書
関
写
板
覧
索
設
栞
歴
スレ情報
赤レス抽出
画像レス抽出
歴の未読スレ
AAサムネイル
Google検索
Wikipedia
ぬこの手
ぬこTOP
0.032s