【オセロ,将棋】ボードゲーム Part3【囲碁,War】 (636レス)
前次1-
抽出解除 必死チェッカー(本家) (べ) 自ID レス栞 あぼーん

リロード規制です。10分ほどで解除するので、他のブラウザへ避難してください。
124: 535 [sage] 2020/02/22(土) 00:47:13.32 ID:j5uEDLd9(1/6) AAS
いや、ちがうっぽい。
うーん。
125: 535 [sage] 2020/02/22(土) 17:03:42.93 ID:j5uEDLd9(2/6) AAS
キター!素のモンテカルロに勝ち越しました!
黒番 31勝20敗
白番 32勝19敗
126: 535 [sage] 2020/02/22(土) 20:31:10.32 ID:j5uEDLd9(3/6) AAS
モンテカルロが間違える局面で間違いを訂正してそれをDNNに学習させる方法ないかなぁ
128: 535 [sage] 2020/02/22(土) 21:53:22.17 ID:j5uEDLd9(4/6) AAS
>>127
127(2): 310 [sage] 2020/02/22(土) 21:32:51.12 ID:wHsEFeMN(1) AAS
間違える局面が特定できているて、間違えた手を訂正できるんなら、
訂正後から対戦再開させて、その棋譜で局面DB更新して、学習するとか。

特定できていなくても、基本強化学習は、対戦→DB更新&学習の
繰り返しで、徐々に間違いを訂正していく方法。もうちょっと工夫する
ならε-Greedyなどの手法で既存の棋譜の途中で無理やり別の手に
分岐させていく。その手が悪くても、「悪い手である」という認識を学習
させる事ができる。

線形計画だとモデルが上手くできていないと学習が飽和しちゃうけど、
DNNだったらある程度うまく学習してくれるかも。
特定も訂正も現状できてないですね。

それよりひどいバグを発見して>>115
115(1): 535 [sage] 2020/02/18(火) 00:27:41.65 ID:kv2P7/8Y(1/3) AAS
とりあえずモンテカルロ1000poで10〜50手打ち進めてその局面で100000po回して結果の黒番の勝利回数、スコアの合計を収集するプログラムを作成。
あんまりいい方法じゃないとはおもうけどこれだというアイディアもないしこれで一回やってみます。
で取ったデータが全て台無しになる可能性が…
129: 535 [sage] 2020/02/22(土) 22:00:44.31 ID:j5uEDLd9(5/6) AAS
あかん、なんか全然おかしいorz
ちゃんと見直さないと…
130: 535 [sage] 2020/02/22(土) 22:22:49.38 ID:j5uEDLd9(6/6) AAS
データ取りからやり直しますorzorzorz
前次1-
スレ情報 赤レス抽出 画像レス抽出 歴の未読スレ AAサムネイル

ぬこの手 ぬこTOP 0.023s