レス書き込み
スレへ戻る
写
レス栞
レス消
【オセロ,将棋】ボードゲーム【囲碁,War】
PC,スマホ,PHSは
ULA
べっかんこ
公式(スマホ)
公式(PC)
で書き込んでください。
名前
メール
引用切替:
レスアンカーのみ
>>901 > 直ったようで何より(^^/ > > 自分は合流させてません。 > 合流させるメリットよりデメリットの方が大きそうだったので考える事をやめました。 > > モンテカルロ木DB化って、よくよく考えたらQ学習みたいなものではないかと思います。 > Q学習だと全部のノードにQ値を持つので、結局全局面保持することになります。 > 現在Deep Q学習が主流になってるのは、Q値をディープラーニングで近似計算する > 事で、全局面のQ値を保持しなくても良くするためという側面もあるかと思います。 > > で、Q学習だと考えるなら、時々変な手を混ぜて木をきちんと分岐させるってのが、 > 強化学習の肝ではないかと思います。 > > > 当方、完全読み切りのバグとり完了。 > ニューラルネットのライブラリも大体できて、1900譜で40手目以後を学習してみました。 > やっぱ、疎行列対応の行列パッケージでの計算は、tiny_dnnと比較して圧倒的に早い > です。 > > データが少ないのと、同一の記譜内からテストデータ取っているのもあるのですが、 > テスト誤差は十分小さな値になるのですが、FFOの盤面を評価させると、いまいち > 合っていない感じで、あまり汎化できていない感じす。もっと記譜増やします。 > > やっつけで作ったmcts部分をきちっとさせるのと、とりあえず持っている評価関数 > で、puct化できるか、ロールアウトの後半の精度を上げられるか、検討開始です。 > 強化学習までまだ遠いなぁ。でも、少し背中が見えてきたかな。
ローカルルール
SETTING.TXT
他の携帯ブラウザのレス書き込みフォームはこちら。
書き込み設定
で書き込みサイトの設定ができます。
・
ULA
・
べっかんこ(身代わりの術)
・
べっかんこ(通常)
・
公式(スマホ)
・
公式(PC)[PC,スマホ,PHS可]
書き込み設定(板別)
で板別の名前とメールを設定できます。
メモ帳
(0/65535文字)
上
下
板
覧
索
設
栞
歴
Google検索
Wikipedia
ぬこの手
ぬこTOP
0.011s