[過去ログ]
【オセロ,将棋】ボードゲーム【囲碁,War】 (1002レス)
上
下
前
次
1-
新
このスレッドは過去ログ倉庫に格納されています。
次スレ検索
歴削→次スレ
栞削→次スレ
過去ログメニュー
776
:
310
2017/03/29(水)21:53
ID:4lOT7Sa+(1)
AA×
[240|
320
|
480
|
600
|
100%
|
JPG
|
べ
|
レス栞
|
レス消
]
776: 310 [sage] 2017/03/29(水) 21:53:37.26 ID:4lOT7Sa+ 大体バグがとれました。 Zebraの学習モードと対局。 F5-D6から10手目までは定石使用。その後40手目まで新AIで手を分析。 途中数回-2の手を打つものの、そのまま終盤まで行き、−4〜−6くらいで安定。 40手前に負け趨勢が判明(勝率30%くらいかな?)するとご乱心モード入り(汗 というわけで、Zebraレベルまで、もう少しという感じです。 評価関数を使用したプレイアウトは、重すぎる上に結果も散々で、結局のところ 以前の角評価付相手着手可能数ヒューリスティックで3手を選択し、75%20% 5%で振り分けるものを使用しています。評価関数型の方は多分softmaxで 使うexpの計算が重いと思うので、テーブル化を検討してみようかと思います。 一番の改善点は・・・。評価関数で悪いと評価された手には、プレイアウトを割り当て ないので、とにかくツリー展開が縦深します。30秒思考で12〜14手目には、一番 読んでいる枝は終局に達しています。これで、モンテカルロの偶然がかなり減って いる印象です。また、余計な横枝が伸びていないので、メモリーにも優しいです。 2手ほど間違えるのは、ツリー展開の初期値で与える評価値の誤差が原因と思います。 ここは、今の評価関数では、これ以上精度出せないので、何か手を考える必要あり。 あと、いくつかの定数調整かな。 http://mevius.5ch.net/test/read.cgi/gamedev/1057763418/776
大体バグがとれました の学習モードと対局 から10手目までは定石使用その後40手目まで新で手を分析 途中数回の手を打つもののそのまま終盤まで行き46くらいで安定 40手前に負け趨勢が判明勝率30くらいかな?するとご乱心モード入り汗 というわけでレベルまでもう少しという感じです 評価関数を使用したプレイアウトは重すぎる上に結果も散で結局のところ 以前の角評価付相手着手可能数ヒューリスティックで3手を選択し7520 5で振り分けるものを使用しています評価関数型の方は多分で 使うの計算が重いと思うのでテーブル化を検討してみようかと思います 一番の改善点は評価関数で悪いと評価された手にはプレイアウトを割り当て ないのでとにかくツリー展開が縦深します30秒思考で1214手目には一番 読んでいる枝は終局に達していますこれでモンテカルロの偶然がかなり減って いる印象ですまた余計な横枝が伸びていないのでメモリーにも優しいです 2手ほど間違えるのはツリー展開の初期値で与える評価値の誤差が原因と思います ここは今の評価関数ではこれ以上精度出せないので何か手を考える必要あり あといくつかの定数調整かな
上
下
前
次
1-
新
書
関
写
板
覧
索
設
栞
歴
あと 226 レスあります
スレ情報
赤レス抽出
画像レス抽出
歴の未読スレ
ぬこの手
ぬこTOP
0.043s