[過去ログ]
【オセロ,将棋】ボードゲーム Part2【囲碁,War】 (1002レス)
上
下
前
次
1-
新
このスレッドは過去ログ倉庫に格納されています。
次スレ検索
歴削→次スレ
栞削→次スレ
過去ログメニュー
296
:
310
2018/03/17(土)02:14
ID:Foa7nGV6(1)
AA×
[
240
|
320
|
480
|600|
100%
|
GIF
|
べ
|
レス栞
|
レス消
]
296: 310 [sage] 2018/03/17(土) 02:14:23.31 ID:Foa7nGV6 なんとなく想像しただけですが、何が悪かったのかわかり始めました。 今の学習は「良い手」しか学習していないという事です。 序盤はある程度ランダムな着手を入れて、結果がばらつくようにしていますが、 途中から読みを入れて、良い手だけで着手し、その結果を遡りで訂正しています。 遡りが有効なのは30手くらいまでで、序盤のランダムは20手程度までに抑えて あります。とすると、遡れる範囲では、悪手を打ったらどういう事になるのかという 学習が抜けている。間違えた着手もちょっとだけ悪いだけでです。結果、最善手の 評価値はそこそこ正確なのですが、極端な悪手も、評価値としてはちょっとだけ 悪い数字でも問題が起きないという事になります。 これはこれで順序付けさえ合っていればそれで良いのですが、ちょっと学習が 進んで、微妙に係数が変わった時に、計算上0.1程度しか悪くない相当な悪手 をうっかり選択しやすくなってしまうという事で、これがオーダリングで悪さをして、 探索時間を長引かせてしまう可能性があります。 恐らく評価関数のステージ分割で、表現力がかなりアップした事から、こういう 学習漏れみたいな事が起きてくるのかなぁと。ほんと、評価関数はスカスカです。 というわけで、昨夜書いたように、ある程度深さを捨てて分岐をすべて記譜に残す ようにしてみようかなぁと思っています。しばらく記譜作成しながら、この事を踏まえ た強化学習をちょっと考えてみたいと思っています。 http://mevius.5ch.net/test/read.cgi/gamedev/1508056498/296
なんとなく想像しただけですが何が悪かったのかわかり始めました 今の学習は良い手しか学習していないという事です 序盤はある程度ランダムな着手を入れて結果がばらつくようにしていますが 途中から読みを入れて良い手だけで着手しその結果を遡りで訂正しています 遡りが有効なのは30手くらいまでで序盤のランダムは20手程度までに抑えて ありますとすると遡れる範囲では悪手を打ったらどういう事になるのかという 学習が抜けている間違えた着手もちょっとだけ悪いだけでです結果最善手の 評価値はそこそこ正確なのですが極端な悪手も評価値としてはちょっとだけ 悪い数字でも問題が起きないという事になります これはこれで順序付けさえ合っていればそれで良いのですがちょっと学習が 進んで微妙に係数が変わった時に計算上01程度しか悪くない相当な悪手 をうっかり選択しやすくなってしまうという事でこれがオーダリングで悪さをして 探索時間を長引かせてしまう可能性があります 恐らく評価関数のステージ分割で表現力がかなりアップした事からこういう 学習漏れみたいな事が起きてくるのかなぁとほんと評価関数はスカスカです というわけで昨夜書いたようにある程度深さを捨てて分岐をすべて記譜に残す ようにしてみようかなぁと思っていますしばらく記譜作成しながらこの事を踏まえ た強化学習をちょっと考えてみたいと思っています
上
下
前
次
1-
新
書
関
写
板
覧
索
設
栞
歴
あと 706 レスあります
スレ情報
赤レス抽出
画像レス抽出
歴の未読スレ
ぬこの手
ぬこTOP
0.056s