【オセロ,将棋】ボードゲーム Part3【囲碁,War】 (636レス)
【オセロ,将棋】ボードゲーム Part3【囲碁,War】 http://mevius.5ch.net/test/read.cgi/gamedev/1574503798/
上
下
前次
1-
新
通常表示
512バイト分割
レス栞
抽出解除
レス栞
106: 310 [sage] 2020/02/11(火) 21:43:38.70 ID:gp4irkBy F5f6の筋復活(汗 その代わり、F5d6E6f4とF5f6E6d6(対称形)に差が出てきて、評価値がずれた。 F5f6E6d6の棋譜をすべてF5f6E6f4に変換して、Bookにはf4系とd6系の2種類登録 しているので、ここの間では差が生じないが、例えばF5f4E3〜の筋からたまたま F5d6E6d6とかに合流してくると、その棋譜については対称変換しないので、差が 生じてしまうという事になるかなと気が付いて、対称変換で差が生じている棋譜を Bookから逆生成してみたところ結構な件数が…というか、ざっくり見積もって既に 3万件超え。どうやって復旧するか悩むところ。というか、おそらくこれやったらまた F5f6の筋が死亡しそうな予感。これから対策を考えます。むむむ。 そのほか、部分的に遡って完全読み切りした時に、そこまでたどり着いていない 筋の方が良い評価値になってしまうという、Bookに生じる矛盾を解消する処理を追加。 こちらは結構綺麗にできた。 http://mevius.5ch.net/test/read.cgi/gamedev/1574503798/106
131: 310 [sage] 2020/02/23(日) 00:56:57.70 ID:9FygPBnT 間違い探しを続けるうちに、何故Zebraの評価値の方がまともに見えるか問題に 突き当りました。で、評価関数を手数毎に60種類に分割している事で、学習データ が不足しているとか、スムージングしていないために、2手前の自分の番の盤面との 差分が取れないとかの問題があるのかなぁと思い立ちまして…。 また、4対称採用した事で学習時間も4倍になってしまいまして…。 思い切って、評価関数を1つにまとめてみたらどうだろうと思い立って、専用の学習 プロジェクトを作ってやってみました。通常数百回学習しないとまともな学習ができ ないのですが、20回学習したところで、意外とフィットしてしまいました。学習時間も 少し減ってる気がする。 一旦評価関数の癖を変えたほうが強化学習も進むかなと思い、とりあえず本番採用 してみました。気持ち速度も速くなった気がしています。もっとも、評価関数の学習具合 によってαβのorderingも変わって速度が変わったりするので、今後学習を積み重ね て、過学習気味になったりした時にどうなるのかは不明。 これから数日動かしてみて、良かったらこっちにしようかと思います。強いオセロAIを 作るのなら、対戦してどっちが強いとかやるのが本来なのですが、特にそういう目標も 現状あるわけでなし(汗 http://mevius.5ch.net/test/read.cgi/gamedev/1574503798/131
286: 535 [sage] 2020/05/12(火) 21:56:06.70 ID:autiDqQV いままで新旧のAIを比較するとき10戦中6勝以上でAI更新にしてたのを50戦中30勝以上で更新にしてみます。 もしかしたら試行回数が少なすぎて弱くなっていてもAI更新してたかもしれないので。 http://mevius.5ch.net/test/read.cgi/gamedev/1574503798/286
299: 310 [sage] 2020/05/20(水) 01:15:22.70 ID:Xgj8E+2H 久々に完全読み切りでバグ発生。 ProbCutを広げながらmtd(f)している時に、どうもパス絡みで発生しているっぽい。 ProbCutによるIterative Wideningを止めたらちゃんと読み切る。 まあ、置換表絡みなんだとは思うけど、事例が少なすぎて(数か月に1回程度)、 前の記録消しちゃったので、とりあえず記録を残し、絆創膏当てて続行。 気が向いたらデバッグしてみる。可能性があるところはなんとなくわかっている つもりだけど。 Book更新時のDAG回避は、かなり悩ましい。というか頭がこんがらがる。 未使用Hashの期待値計算も頭が未だにこんがらがってます。。 http://mevius.5ch.net/test/read.cgi/gamedev/1574503798/299
383: 310 [sage] 2020/11/27(金) 22:44:47.70 ID:hZcTJqyt ご無沙汰です。 現在棋譜は160万くらいになっています。縦掘り型の貪欲法が良い調子なので、学習より 棋譜作成を優先しています。残り30手推定パブリックドローは相変わらず1100〜1300件 くらいを行ったり来たりしています。まだ、知られていないドロー筋がありそうです。 やねうら王さんのサイト見ていたら、終盤近辺のヒューリスティックスオーダリングのアイデア (偶数理論がらみ)を思いついてしまった。どうしよう(汗 羽生さん残念だったね。 正月のabemaTVトーナメントスピンオフ企画が楽しみです。 http://mevius.5ch.net/test/read.cgi/gamedev/1574503798/383
551: 535 [sage] 2021/10/23(土) 16:56:30.70 ID:QOsHN9x8 実をいうと囲連星のAI作成をまたやっていて、 LV3に開幕19連勝というとんでもない数字をたたき出したのですが 100戦もすると勝率5割ほどに落ちてきてしまい、 なぜこんなことが起こるのだろうと不思議に思っていたのです。 どうやら糞粘りのせいみたいですね。 http://mevius.5ch.net/test/read.cgi/gamedev/1574503798/551
メモ帳
(0/65535文字)
上
下
前次
1-
新
書
関
写
板
覧
索
設
栞
歴
スレ情報
赤レス抽出
画像レス抽出
歴の未読スレ
AAサムネイル
Google検索
Wikipedia
ぬこの手
ぬこTOP
0.604s*