[過去ログ]
【オセロ,将棋】ボードゲーム【囲碁,War】 (1002レス)
上
下
前
次
1-
新
このスレッドは過去ログ倉庫に格納されています。
次スレ検索
歴削→次スレ
栞削→次スレ
過去ログメニュー
901
:
310
2017/07/12(水)20:10
ID:b5nvOjQF(1/2)
AA×
[240|
320
|
480
|
600
|
100%
|
JPG
|
べ
|
レス栞
|
レス消
]
901: 310 [sage] 2017/07/12(水) 20:10:09.86 ID:b5nvOjQF 直ったようで何より(^^/ 自分は合流させてません。 合流させるメリットよりデメリットの方が大きそうだったので考える事をやめました。 モンテカルロ木DB化って、よくよく考えたらQ学習みたいなものではないかと思います。 Q学習だと全部のノードにQ値を持つので、結局全局面保持することになります。 現在Deep Q学習が主流になってるのは、Q値をディープラーニングで近似計算する 事で、全局面のQ値を保持しなくても良くするためという側面もあるかと思います。 で、Q学習だと考えるなら、時々変な手を混ぜて木をきちんと分岐させるってのが、 強化学習の肝ではないかと思います。 当方、完全読み切りのバグとり完了。 ニューラルネットのライブラリも大体できて、1900譜で40手目以後を学習してみました。 やっぱ、疎行列対応の行列パッケージでの計算は、tiny_dnnと比較して圧倒的に早い です。 データが少ないのと、同一の記譜内からテストデータ取っているのもあるのですが、 テスト誤差は十分小さな値になるのですが、FFOの盤面を評価させると、いまいち 合っていない感じで、あまり汎化できていない感じす。もっと記譜増やします。 やっつけで作ったmcts部分をきちっとさせるのと、とりあえず持っている評価関数 で、puct化できるか、ロールアウトの後半の精度を上げられるか、検討開始です。 強化学習までまだ遠いなぁ。でも、少し背中が見えてきたかな。 http://mevius.5ch.net/test/read.cgi/gamedev/1057763418/901
直ったようで何より 自分は合流させてません 合流させるメリットよりデメリットの方が大きそうだったので考える事をやめました モンテカルロ木化ってよくよく考えたら学習みたいなものではないかと思います 学習だと全部のノードに値を持つので結局全局面保持することになります 現在 学習が主流になってるのは値をディープラーニングで近似計算する 事で全局面の値を保持しなくても良くするためという側面もあるかと思います で学習だと考えるなら時変な手を混ぜて木をきちんと分岐させるってのが 強化学習の肝ではないかと思います 当方完全読み切りのバグとり完了 ニューラルネットのライブラリも大体できて譜で40手目以後を学習してみました やっぱ疎行列対応の行列パッケージでの計算はと比較して圧倒的に早い です データが少ないのと同一の記譜内からテストデータ取っているのもあるのですが テスト誤差は十分小さな値になるのですがの盤面を評価させるといまいち 合っていない感じであまり汎化できていない感じすもっと記譜増やします やっつけで作った部分をきちっとさせるのととりあえず持っている評価関数 で化できるかロールアウトの後半の精度を上げられるか検討開始です 強化学習までまだ遠いなぁでも少し背中が見えてきたかな
上
下
前
次
1-
新
書
関
写
板
覧
索
設
栞
歴
あと 101 レスあります
スレ情報
赤レス抽出
画像レス抽出
歴の未読スレ
ぬこの手
ぬこTOP
0.055s