【オセロ,将棋】ボードゲーム Part3【囲碁,War】 (636レス)
1-
抽出解除 レス栞

リロード規制です。10分ほどで解除するので、他のブラウザへ避難してください。
123: 535 [sage] 2020/02/21(金) 22:56:34.67 ID:/4d3LiPl(2/2) AAS
単に白番有利説が急浮上www
124: 535 [sage] 2020/02/22(土) 00:47:13.32 ID:j5uEDLd9(1/6) AAS
いや、ちがうっぽい。
うーん。
125: 535 [sage] 2020/02/22(土) 17:03:42.93 ID:j5uEDLd9(2/6) AAS
キター!素のモンテカルロに勝ち越しました!
黒番 31勝20敗
白番 32勝19敗
126: 535 [sage] 2020/02/22(土) 20:31:10.32 ID:j5uEDLd9(3/6) AAS
モンテカルロが間違える局面で間違いを訂正してそれをDNNに学習させる方法ないかなぁ
128: 535 [sage] 2020/02/22(土) 21:53:22.17 ID:j5uEDLd9(4/6) AAS
>>127
127(2): 310 [sage] 2020/02/22(土) 21:32:51.12 ID:wHsEFeMN(1) AAS
間違える局面が特定できているて、間違えた手を訂正できるんなら、
訂正後から対戦再開させて、その棋譜で局面DB更新して、学習するとか。

特定できていなくても、基本強化学習は、対戦→DB更新&学習の
繰り返しで、徐々に間違いを訂正していく方法。もうちょっと工夫する
ならε-Greedyなどの手法で既存の棋譜の途中で無理やり別の手に
分岐させていく。その手が悪くても、「悪い手である」という認識を学習
させる事ができる。

線形計画だとモデルが上手くできていないと学習が飽和しちゃうけど、
DNNだったらある程度うまく学習してくれるかも。
特定も訂正も現状できてないですね。

それよりひどいバグを発見して>>115
115(1): 535 [sage] 2020/02/18(火) 00:27:41.65 ID:kv2P7/8Y(1/3) AAS
とりあえずモンテカルロ1000poで10〜50手打ち進めてその局面で100000po回して結果の黒番の勝利回数、スコアの合計を収集するプログラムを作成。
あんまりいい方法じゃないとはおもうけどこれだというアイディアもないしこれで一回やってみます。
で取ったデータが全て台無しになる可能性が…
129: 535 [sage] 2020/02/22(土) 22:00:44.31 ID:j5uEDLd9(5/6) AAS
あかん、なんか全然おかしいorz
ちゃんと見直さないと…
130: 535 [sage] 2020/02/22(土) 22:22:49.38 ID:j5uEDLd9(6/6) AAS
データ取りからやり直しますorzorzorz
135: 535 [sage] 2020/02/23(日) 22:36:15.39 ID:xJvwRHu1(1) AAS
オーバーフローが嫌だからついlong longを使ってしまうw
メモリ余計に食うけど。
136: 535 [sage] 2020/02/24(月) 18:53:46.31 ID:S84dSY4F(1) AAS
タイルゲーム、完全解析した後でもそれなりに楽しめる不思議。自力では勝てないからな。
そういやconnect4より複雑で完全解析されててネットで遊べるゲームってなにかあるのかな?
137: 535 [sage] 2020/02/25(火) 20:37:07.39 ID:10rOW9ls(1) AAS
データ取りなおしたので再度DNN学習させてみます。
ついでにネットワーク少し大きくしてみます。
138: 535 [sage] 2020/02/26(水) 20:24:56.08 ID:LbNvrAvP(1/5) AAS
なんかDNNほぼ最悪の手を打つんだが…
真逆の学習させちまったか?
139: 535 [sage] 2020/02/26(水) 20:40:14.06 ID:LbNvrAvP(2/5) AAS
試しに評価値に*-1してみたがやっぱり悪い手を打つ。
真逆ってわけでもないのか?
わけわからん
140: 535 [sage] 2020/02/26(水) 20:50:37.02 ID:LbNvrAvP(3/5) AAS
モンテカルロ木探索の部分が間違ってたっぽい
141: 535 [sage] 2020/02/26(水) 21:22:57.03 ID:LbNvrAvP(4/5) AAS
うーん、なんかアルファ碁Leeみたいに、数手前の手順を学習データとして食わせるといいかもなぁ。
石がぶつかってる時の判断がちょっとおかしいんだよなぁ
142: 535 [sage] 2020/02/26(水) 21:35:19.66 ID:LbNvrAvP(5/5) AAS
もうヒューリスティックもモリモリ入れちゃおうかなぁ
143: 535 [sage] 2020/02/27(木) 19:12:50.92 ID:7f4H7cqb(1/2) AAS
お、微妙に勝ち越している。
でも微妙すぎw
144: 535 [sage] 2020/02/27(木) 21:11:32.40 ID:7f4H7cqb(2/2) AAS
先制攻撃を仕掛ける体制が整っているかどうかの判定が今後の課題ですね。
145: 535 [sage] 2020/03/01(日) 21:57:12.55 ID:X+Ti9n7n(1) AAS
先制攻撃を仕掛けた時に反撃で逆に取られる確率とか学習させたら駄目かなぁ?
146: 535 [sage] 2020/03/02(月) 06:27:35.74 ID:Td8MIT1I(1) AAS
ある局面に対し、それぞれの点が黒の地になる確率のベクタを返すようにDNNを学習したらどうだろう?
147: 535 [sage] 2020/03/03(火) 21:11:27.98 ID:PL4UDoSq(1) AAS
前回はスコア差を評価値に学習させましたが、今回は勝率で学習させてみます。
結局セオリー通りがいいのかもしれないので。
ホントはスコア最大化はぜひともやりたいんだけど。
148: 535 [sage] 2020/03/04(水) 20:23:35.42 ID:Q7ItuMwb(1/7) AAS
勝率で学習させたら黒番は勝ち越してますが、白番は負け越してますね。
白番でも勝てると思いましたが。
149: 535 [sage] 2020/03/04(水) 20:44:28.42 ID:Q7ItuMwb(2/7) AAS
うお、バグ発見w
DNNが全く働いてなかったww
黒番で勝ち越したのはたまたまやなこれは。
150: 535 [sage] 2020/03/04(水) 21:10:05.82 ID:Q7ItuMwb(3/7) AAS
うーん、石をくっつけて打つなぁ
もっとばらけさせたほうがいいと思うんだけど。
151: 535 [sage] 2020/03/04(水) 21:14:38.18 ID:Q7ItuMwb(4/7) AAS
うーん、石がくっついているか離れているか標準偏差のようなものを出して学習パラメータに渡すとか
152: 535 [sage] 2020/03/04(水) 21:17:15.27 ID:Q7ItuMwb(5/7) AAS
ホントはあんま手動で特徴量出そうとするのよくないアイディアなんだろうけど。
1-
スレ情報 赤レス抽出 画像レス抽出 歴の未読スレ AAサムネイル

ぬこの手 ぬこTOP 0.027s