[過去ログ] 【オセロ,将棋】ボードゲーム Part2【囲碁,War】 (1002レス)
上下前次1-新
このスレッドは過去ログ倉庫に格納されています。
次スレ検索 歴削→次スレ 栞削→次スレ 過去ログメニュー
119: 535 2017/12/06(水)22:03 ID:D/I5x6A8(5/7) AAS
いっそ完全解析してくれたら諦めつくんですけどねw
120: 535 2017/12/06(水)22:49 ID:D/I5x6A8(6/7) AAS
9路囲連星のDB作りはじめました。
何日かぶん回そう。
121: 310 2017/12/06(水)23:02 ID:fJiMVswg(2/2) AAS
non-MonteCalroなツリー探索(勝手にそう呼んでる)は、MCTSがロールアウト
関数さえ作れれば万能なように、完全情報ゲームでは万能だと思う。
あと強化学習による評価関数の作成も。
ただ、まだAlpha碁Zeroの論文読んでないからわからないけど、CNNの入力
については、人間が介在しているかもしれない。少なくともアルファ碁の段階
では、ちょっと特殊な入力データを用意していた。
それと、完全情報ができない以上、強さの地平線を広げたに過ぎないのも確か。
それを実現するために圧倒的なマシンパワーを使っているわけで。そのマシン
パワーを前提に、それを完全に活かせるアルゴリズムにしたってところが、評価
ポイントなのかもしれない。
かなり悔し紛れな評価だけどorz
122: 535 2017/12/06(水)23:52 ID:D/I5x6A8(7/7) AAS
ガンガンツリー展開して全部DBに突っ込んでたら意外と早くメモリがパンクした。
相変わらず学習しない俺w
しょうがないからDBに入れるのは序盤だけにするか。
123: 310 2017/12/07(木)00:22 ID:EKyZH2pF(1) AAS
Googleがやらかしてから、後だしで俺も考えていたとか悔しいので、
前から思っている事をボソっと書いとく。
十分に深いDCNNの場合、表現の自由度が高いから、強化学習を繰り返す
事で過学習になる事が、起こりうる局面の大半を内部に保持する事につな
がっていて、実は汎化性能ガン無視で良いのではないか。起こりにくい局面の
評価値はグチャグチャでも構わないという事で。
と思っていたりする。
124: 535 2017/12/07(木)00:55 ID:+QWWXInu(1/9) AAS
修正してみたけど、8プロセス並列で動かすと意外とまだメモリがきついな。
しょうがないから1プロセスだけで流すか。
125: 535 2017/12/07(木)01:11 ID:+QWWXInu(2/9) AAS
うーん、なんか同じ局面しか選ばなくなっちゃう。
これは致命的な欠陥だなぁ。
どうしよう?
126: 535 2017/12/07(木)01:18 ID:+QWWXInu(3/9) AAS
駄目だ分からん。
諦めて今日は寝よう。
127: 535 2017/12/07(木)20:11 ID:+QWWXInu(4/9) AAS
あ〜ツリーのノードに親ノードポインタ入れてなかったわw
変だと思ったw。
でも対称局面合流させちゃってるから親が一意にならないな。。。
どうしよう。。
128: 535 2017/12/07(木)20:23 ID:+QWWXInu(5/9) AAS
親ポインタは諦めてほかの方法でごまかそうw
129(1): 535 2017/12/07(木)21:27 ID:+QWWXInu(6/9) AAS
なんか、UCTって初期の探索で間違った結果出ると挽回するの凄い大変なのかね?
それこそ修正に指数的な試行が必要になっているような…
130: 535 2017/12/07(木)21:35 ID:+QWWXInu(7/9) AAS
おっと、なんか挽回してきたw
それはそうとして、メモリが欲しいですねぇ。1TBくらい
131: 535 2017/12/07(木)22:05 ID:+QWWXInu(8/9) AAS
うーん、局所解にずっぽり嵌ったっぽいorz
地力で脱出してくれないかな〜
132: 310 2017/12/07(木)22:57 ID:JixNNylG(1) AAS
>>129
大変です(汗
133: 535 2017/12/07(木)23:14 ID:+QWWXInu(9/9) AAS
うおお、メモリ消費がじわじわ増えてきてる。
今晩一晩耐えられるかは微妙なラインだなぁ。
134: 535 2017/12/08(金)21:44 ID:rkwPxGLh(1/3) AAS
あれえ、おかしいな。
かなり学習いい感じで進んだと思ったのに、公式AIに全く歯が立たない。
やっぱ読めてない局面に分岐されると無力なのかなぁ
135: 535 2017/12/08(金)21:55 ID:rkwPxGLh(2/3) AAS
DBだけじゃ無理か。
期待が高かっただけにガックリ。
136: 535 2017/12/08(金)22:03 ID:rkwPxGLh(3/3) AAS
ここでヒューリスティックに走るかDBの更なる肥大化に走るかCNNとかに手を出すか。
分岐点やな。
137: 535 2017/12/09(土)11:22 ID:L/Fjd2gI(1/5) AAS
当たりの石をつがないなぁなぜか。
ロールアウトで当たりの石を抜く確率と当たりの石をつぐ確率増やすか。
138: 535 2017/12/09(土)19:05 ID:L/Fjd2gI(2/5) AAS
キター!初勝利!
最終的にはアルファ碁みたいに100戦100勝したいな。
(
;FF[1]GM[1]SZ[9]
;B[de];W[dg];B[ef];W[cc];B[eg];W[fd]
;B[ec];W[eh];B[ed];W[ch];B[eb];W[fe]
;B[ee];W[ea];B[fa];W[hh];B[da];W[ac]
;B[ea])
139: 535 2017/12/09(土)20:29 ID:L/Fjd2gI(3/5) AAS
酷いバグ発見w
8近傍求める関数間違ってたw
140: 2017/12/09(土)21:36 ID:L/Fjd2gI(4/5) AAS
ロールアウトの着手確率いじったら黒番の勝率5%だと…?
何が起こってるんだ…
141: 535 2017/12/09(土)22:53 ID:L/Fjd2gI(5/5) AAS
着手不能点を着手候補にしてたw
だからか。
142: 535 2017/12/10(日)21:26 ID:ecwKDJmF(1/2) AAS
局所解に落ち込むとなかなか抜け出せないのでUCB1のバイアス係数を思いっきり上げてみた。
これで局所解抜けてくれればいいが…
143: 310 2017/12/10(日)22:11 ID:3vDAj4sl(1) AAS
MLP版の評価関数がNaN地獄に落ちてた。
何回かやり直したけど、結構簡単にNaN地獄に落ちるので、一旦仕切り直しで、
線形回帰な評価関数に注力する事にしました。
MCTSでテストすると、途中まで割と見知ったオープニングになってきているけど、
評価値自体はあんまり安定していない感じ。まあ、相対関係があっていれば、
絶対値はずれていても関係ないといえば関係ないけど。
しばらく強化学習を続けながら、ちっと別な事を考えてみます。
というか、Alpha Zeroの強化学習の回数が、思ったより少ないなぁと思ったけど、
自分がこれまでにやった回数を概算で考えてみたら、桁が2〜3くらい少なかったorz
やっぱマシンパワーは正義だなぁ。
144: 535 2017/12/10(日)22:51 ID:ecwKDJmF(2/2) AAS
今晩一晩ながして局所解抜け出せなかったら別の方法考えなきゃな…
zen+が超絶スペックという噂が流れてますが、デマリークともいわれていて、
本当だったらいいなあと思っている今日この頃。
145: 535 2017/12/11(月)21:43 ID:fAOHhVpN(1/5) AAS
お、局所解抜けてる。
DBがTXTで1GB行っちゃったてへぺろ。
146(1): 535 2017/12/11(月)21:49 ID:fAOHhVpN(2/5) AAS
お、凄い、いい感じの勝ち方した。
これの凄さが分かってくれる人がどれだけいるかわからないが…
(
;FF[1]GM[1]SZ[9]
;B[ee];W[eg];B[df];W[fd];B[dc];W[dg]
;B[fe];W[ge];B[gd];W[gf];B[fc];W[cd]
;B[ed];W[cc];B[cg];W[ch];B[bg];W[fg]
;B[gc];W[gh];B[bh];W[hh];B[ai];W[ba]
;B[fd])
147: 535 2017/12/11(月)22:02 ID:fAOHhVpN(3/5) AAS
白番でも勝てるかもと思ったがそんなに甘くなかったw
148: 535 2017/12/11(月)22:20 ID:fAOHhVpN(4/5) AAS
うあああ、白番で惜しいところまで行ってバグで不正終了w
とりあえずバグとらなきゃorz
上下前次1-新書関写板覧索設栞歴
あと 854 レスあります
スレ情報 赤レス抽出 画像レス抽出 歴の未読スレ
ぬこの手 ぬこTOP 0.026s