レス書き込み
スレへ戻る
写
レス栞
レス消
【オセロ,将棋】ボードゲーム Part2【囲碁,War】
PC,スマホ,PHSは
ULA
べっかんこ
公式(スマホ)
公式(PC)
で書き込んでください。
名前
メール
引用切替:
レスアンカーのみ
>>296 > なんとなく想像しただけですが、何が悪かったのかわかり始めました。 > 今の学習は「良い手」しか学習していないという事です。 > > 序盤はある程度ランダムな着手を入れて、結果がばらつくようにしていますが、 > 途中から読みを入れて、良い手だけで着手し、その結果を遡りで訂正しています。 > 遡りが有効なのは30手くらいまでで、序盤のランダムは20手程度までに抑えて > あります。とすると、遡れる範囲では、悪手を打ったらどういう事になるのかという > 学習が抜けている。間違えた着手もちょっとだけ悪いだけでです。結果、最善手の > 評価値はそこそこ正確なのですが、極端な悪手も、評価値としてはちょっとだけ > 悪い数字でも問題が起きないという事になります。 > > これはこれで順序付けさえ合っていればそれで良いのですが、ちょっと学習が > 進んで、微妙に係数が変わった時に、計算上0.1程度しか悪くない相当な悪手 > をうっかり選択しやすくなってしまうという事で、これがオーダリングで悪さをして、 > 探索時間を長引かせてしまう可能性があります。 > > 恐らく評価関数のステージ分割で、表現力がかなりアップした事から、こういう > 学習漏れみたいな事が起きてくるのかなぁと。ほんと、評価関数はスカスカです。 > > というわけで、昨夜書いたように、ある程度深さを捨てて分岐をすべて記譜に残す > ようにしてみようかなぁと思っています。しばらく記譜作成しながら、この事を踏まえ > た強化学習をちょっと考えてみたいと思っています。
ローカルルール
SETTING.TXT
他の携帯ブラウザのレス書き込みフォームはこちら。
書き込み設定
で書き込みサイトの設定ができます。
・
ULA
・
べっかんこ(身代わりの術)
・
べっかんこ(通常)
・
公式(スマホ)
・
公式(PC)[PC,スマホ,PHS可]
書き込み設定(板別)
で板別の名前とメールを設定できます。
メモ帳
(0/65535文字)
上
下
板
覧
索
設
栞
歴
Google検索
Wikipedia
ぬこの手
ぬこTOP
0.015s