【オセロ,将棋】ボードゲーム Part3【囲碁,War】 (636レス)
上
下
前
次
1-
新
189
:
310
2020/03/18(水)23:45
ID:Wk4mfxEa(2/3)
AA×
[240|
320
|
480
|
600
|
100%
|
GIF
|
べ
|
レス栞
|
レス消
]
189: 310 [sage] 2020/03/18(水) 23:45:39.14 ID:Wk4mfxEa 実現確率探索の中盤探索、プロトタイプのαβ版を作って癖を見ています。 実現確率は、評価値のSoftmaxで各要素を足して1.0になるように正規化するより、 最大値が1.0になるようにした方が使いやすいです。というのも、最大値をひたすら 追った枝の終了条件が綺麗に決まって最大深さを指定できるようになるからです。 1.0そのままだと終わらないので、例えば0.5にしておくと、深さnにしたい時は1÷2^n が閾値になります。0.1の時は1÷10^nです。まあ、なんでもよいという事です。 後は各要素の差のつき具合を決める定数を調整すると、評価値が悪い手について、 どこまで探索の深さを確保するのかが決まります。ここが職人的作業なのがネック。 絞ると爆速。∞だと、ただの全幅探索になります。 速度は結構出てるのですが、調整ミスると全くダメみたいな様子が見え隠れしていて、 本当に常に使えるのか、まだ心配です。おそらくProbCutでも同じような問題がおきて いるんじゃないかと思いますが。 次は置換表ですが、合流が発生した時の実現確率がルートによって違うので、その 時の置換表の評価値を使って良いのか悩みどころです。また、上述のように最大探索 深さを調整できるので、反復進化的に閾値を下げて行く事が可能性です。そうすると、 反復深化的に使いたくなるのが人情ですが、オーダリングにどのように反映するのが 良いのか。これも悩みどころだったりします。 要するにあと1週間くらいは遊べそうです(笑) http://mevius.5ch.net/test/read.cgi/gamedev/1574503798/189
実現確率探索の中盤探索プロトタイプの版を作って癖を見ています 実現確率は評価値ので各要素を足して10になるように正規化するより 最大値が10になるようにした方が使いやすいですというのも最大値をひたすら 追った枝の終了条件が麗に決まって最大深さを指定できるようになるからです 10そのままだと終わらないので例えば05にしておくと深さにしたい時は12 が値になります01の時は110ですまあなんでもよいという事です 後は各要素の差のつき具合を決める定数を調整すると評価値が悪い手について どこまで探索の深さを確保するのかが決まりますここが職人的作業なのがネック 絞ると爆速だとただの全幅探索になります 速度は結構出てるのですが調整ミスると全くダメみたいな様子が見え隠れしていて 本当に常に使えるのかまだ心配ですおそらくでも同じような問題がおきて いるんじゃないかと思いますが 次は置換表ですが合流が発生した時の実現確率がルートによって違うのでその 時の置換表の評価値を使って良いのか悩みどころですまた上述のように最大探索 深さを調整できるので反復進化的に値を下げて行く事が可能性ですそうすると 反復深化的に使いたくなるのが人情ですがオーダリングにどのように反映するのが 良いのかこれも悩みどころだったりします 要するにあと1週間くらいは遊べそうです笑
上
下
前
次
1-
新
書
関
写
板
覧
索
設
栞
歴
あと 447 レスあります
スレ情報
赤レス抽出
画像レス抽出
歴の未読スレ
ぬこの手
ぬこTOP
0.048s