[過去ログ]
【オセロ,将棋】ボードゲーム【囲碁,War】 (1002レス)
【オセロ,将棋】ボードゲーム【囲碁,War】 http://mevius.5ch.net/test/read.cgi/gamedev/1057763418/
上
下
前次
1-
新
通常表示
512バイト分割
レス栞
抽出解除
必死チェッカー(本家)
(べ)
自ID
レス栞
あぼーん
このスレッドは過去ログ倉庫に格納されています。
次スレ検索
歴削→次スレ
栞削→次スレ
過去ログメニュー
912: 310 [sage] 2017/07/22(土) 02:06:09.72 ID:6HI7Rmqm 結局40手までランダム+残り20手完全読みな記譜集めて、残り20手の評価関数と Policyを作ってます。ランダム1000件に対して30件のMCTS自己対戦混ぜたもので 学習してます。ランダムだけで十分学習になるようで、悩むより数を集める方が大事な 感じです。40手以後の評価関数ですが、30手過ぎくらいから、そこそこ使えるみたい です。 で、これを使ってPUCTな形にしてます。 完全読みが使えないので、20〜40手あたりで最善手(に近い手順)をどうやって 作ろうかという感じです。 まずは、後ろから探索で、何手までまともな手だったか遡るプログラムを作って、 残り25手くらいまで遡れたら良いかなぁと。 つか、強化学習に行っちゃおうかなぁ。 http://mevius.5ch.net/test/read.cgi/gamedev/1057763418/912
913: 310 [sage] 2017/07/22(土) 20:32:19.70 ID:6HI7Rmqm 逆順チェックのプログラムして、学習時に、正解手順で遡れる盤面も含むようにして みました。仕組みとしては、最終盤面からヌルウィンドウサーチして、もっと良い評価に なる手が無いことをチェックして、OKなら1手遡ります。置換表にてPVの評価は即求まる のと、ヌルウィンドウサーチを使っているので、25手までなら楽勝です。 MCTSで対戦したデータには27手より前まで遡れるものもあるようですが、丸1日 チェックしても終わりそうにないので、25手で打ち切り処理を入れました。 記譜に正解手順で遡れる手数を持たせて、学習時には、その手番以後の盤面を使用 する事で、30手過ぎの評価の精度を上げられたら良いなぁと思います。 http://mevius.5ch.net/test/read.cgi/gamedev/1057763418/913
メモ帳
(0/65535文字)
上
下
前次
1-
新
書
関
写
板
覧
索
設
栞
歴
スレ情報
赤レス抽出
画像レス抽出
歴の未読スレ
AAサムネイル
Google検索
Wikipedia
ぬこの手
ぬこTOP
0.029s