[過去ログ] 【オセロ,将棋】ボードゲーム Part2【囲碁,War】 (1002レス)
1-

このスレッドは過去ログ倉庫に格納されています。
次スレ検索 歴削→次スレ 栞削→次スレ 過去ログメニュー
131: 535 2017/12/07(木)22:05 ID:+QWWXInu(8/9) AAS
うーん、局所解にずっぽり嵌ったっぽいorz
地力で脱出してくれないかな〜
132: 310 2017/12/07(木)22:57 ID:JixNNylG(1) AAS
>>129
大変です(汗
133: 535 2017/12/07(木)23:14 ID:+QWWXInu(9/9) AAS
うおお、メモリ消費がじわじわ増えてきてる。
今晩一晩耐えられるかは微妙なラインだなぁ。
134: 535 2017/12/08(金)21:44 ID:rkwPxGLh(1/3) AAS
あれえ、おかしいな。
かなり学習いい感じで進んだと思ったのに、公式AIに全く歯が立たない。
やっぱ読めてない局面に分岐されると無力なのかなぁ
135: 535 2017/12/08(金)21:55 ID:rkwPxGLh(2/3) AAS
DBだけじゃ無理か。
期待が高かっただけにガックリ。
136: 535 2017/12/08(金)22:03 ID:rkwPxGLh(3/3) AAS
ここでヒューリスティックに走るかDBの更なる肥大化に走るかCNNとかに手を出すか。
分岐点やな。
137: 535 2017/12/09(土)11:22 ID:L/Fjd2gI(1/5) AAS
当たりの石をつがないなぁなぜか。
ロールアウトで当たりの石を抜く確率と当たりの石をつぐ確率増やすか。
138: 535 2017/12/09(土)19:05 ID:L/Fjd2gI(2/5) AAS
キター!初勝利!
最終的にはアルファ碁みたいに100戦100勝したいな。

(
;FF[1]GM[1]SZ[9]
;B[de];W[dg];B[ef];W[cc];B[eg];W[fd]
;B[ec];W[eh];B[ed];W[ch];B[eb];W[fe]
;B[ee];W[ea];B[fa];W[hh];B[da];W[ac]
;B[ea])
139: 535 2017/12/09(土)20:29 ID:L/Fjd2gI(3/5) AAS
酷いバグ発見w
8近傍求める関数間違ってたw
140: 2017/12/09(土)21:36 ID:L/Fjd2gI(4/5) AAS
ロールアウトの着手確率いじったら黒番の勝率5%だと…?
何が起こってるんだ…
141: 535 2017/12/09(土)22:53 ID:L/Fjd2gI(5/5) AAS
着手不能点を着手候補にしてたw
だからか。
142: 535 2017/12/10(日)21:26 ID:ecwKDJmF(1/2) AAS
局所解に落ち込むとなかなか抜け出せないのでUCB1のバイアス係数を思いっきり上げてみた。
これで局所解抜けてくれればいいが…
143: 310 2017/12/10(日)22:11 ID:3vDAj4sl(1) AAS
MLP版の評価関数がNaN地獄に落ちてた。
何回かやり直したけど、結構簡単にNaN地獄に落ちるので、一旦仕切り直しで、
線形回帰な評価関数に注力する事にしました。

MCTSでテストすると、途中まで割と見知ったオープニングになってきているけど、
評価値自体はあんまり安定していない感じ。まあ、相対関係があっていれば、
絶対値はずれていても関係ないといえば関係ないけど。

しばらく強化学習を続けながら、ちっと別な事を考えてみます。

というか、Alpha Zeroの強化学習の回数が、思ったより少ないなぁと思ったけど、
自分がこれまでにやった回数を概算で考えてみたら、桁が2〜3くらい少なかったorz
やっぱマシンパワーは正義だなぁ。
144: 535 2017/12/10(日)22:51 ID:ecwKDJmF(2/2) AAS
今晩一晩ながして局所解抜け出せなかったら別の方法考えなきゃな…
zen+が超絶スペックという噂が流れてますが、デマリークともいわれていて、
本当だったらいいなあと思っている今日この頃。
145: 535 2017/12/11(月)21:43 ID:fAOHhVpN(1/5) AAS
お、局所解抜けてる。
DBがTXTで1GB行っちゃったてへぺろ。
146
(1): 535 2017/12/11(月)21:49 ID:fAOHhVpN(2/5) AAS
お、凄い、いい感じの勝ち方した。
これの凄さが分かってくれる人がどれだけいるかわからないが…

(
;FF[1]GM[1]SZ[9]
;B[ee];W[eg];B[df];W[fd];B[dc];W[dg]
;B[fe];W[ge];B[gd];W[gf];B[fc];W[cd]
;B[ed];W[cc];B[cg];W[ch];B[bg];W[fg]
;B[gc];W[gh];B[bh];W[hh];B[ai];W[ba]
;B[fd])
147: 535 2017/12/11(月)22:02 ID:fAOHhVpN(3/5) AAS
白番でも勝てるかもと思ったがそんなに甘くなかったw
148: 535 2017/12/11(月)22:20 ID:fAOHhVpN(4/5) AAS
うあああ、白番で惜しいところまで行ってバグで不正終了w
とりあえずバグとらなきゃorz
149: 535 2017/12/11(月)22:31 ID:fAOHhVpN(5/5) AAS
うーんまだまだだなぁ。
>>146はたまたまかorz.
150: 535 2017/12/12(火)19:50 ID:sU/cgenP(1/2) AAS
新しいパソコン欲しいな〜
現実的な線でいってもメモリ64GBくらい積みたい。
151: 535 2017/12/12(火)23:05 ID:sU/cgenP(2/2) AAS
DB作成をマルチスレッド化したいな〜
でもMCTSのマルチスレッド化って結構難しんだよな〜
152: 310 2017/12/13(水)00:38 ID:oWC3TnL7(1) AAS
MCTSのマルチスレッド化は簡単だと思う…
マルチコンピュータは難しいけど。

強化学習がなんかおかしい感じだったので、記譜学習で上書きしたら
かなり過学習になってしまった。強化学習で戻せばよいかと思ったけど
なんかなかなか戻らないorz

強化学習どっかおかしいのかもしれない。
153: 535 2017/12/13(水)20:33 ID:6thdoy0s(1) AAS
えーそうですか?
排他制御とかしたら性能出なさそう
154: 535 2017/12/13(水)21:57 ID:3yqEn+ak(1/2) AAS
ID違うと思うけど535です。
DBがTXTで1.7GBに。
実行時7GB程になりました。
std::mapを別のコレクションに変えたらメモリ使用量減らないかな〜?
155: 535 2017/12/13(水)22:15 ID:3yqEn+ak(2/2) AAS
unordered_mapにしてみたけどあんま変わんないやorz
156: 310 2017/12/14(木)00:19 ID:9pKHf6s7(1) AAS
排他制御は、まあ普通にしてますけど、PPLのcritical_sectionでlockしたり、
int型ならatomic<int>していたりで、並列ライブラリにお任せです。

またVirtual Lossという方法があって、ツリーを下っていく時は、先に負けた事にして
降りて行って、末端から戻ってくる時に正しい勝敗に置き換える事で、並列探索
の各スレッドが同じ枝に集中しないようにして、排他がかかる可能性を減らしてます。
あとは、排他制御が必要な領域を細かい単位に分割する事ですかね。

#と思って、ソース見たらVirtual Drawになっていた(汗

あ、そうか。DB化しているって事は、合流ありだし、盤面をキーにしなきゃならないから
そうなるとちょっとややこしいのかな?

自分は合流無視で、各ノードに盤面情報を保持していません。直前着手のみ持って
いて、ノードをたどる時に盤面情報を更新しながら降りていきます。着手もBITBOARD
の64bitは無駄なので、char型にしちゃってます(内部的にはintなんだろうけど)。
157: 535 2017/12/14(木)21:56 ID:IX7WwuCO(1) AAS
PPLなんてのがあるんですね。
頭の片隅に入れておきます。

とりあえず、子ノードへのポインタが結構メモリを食ってるような気がします。
これを無くして毎回子局面を計算するようにしてメモリ節約するという手もありますがあんまりやる気がしないなぁ。
158: 310 2017/12/15(金)10:32 ID:+7BwQo/4(1) AAS
PPLはVC++専用の並列処理ライブラリです。
Intel TBBとかと中身はほぼ同じだと思います。
かなり抽象されていて、わかりやすいです。
自分はこれなしでは並列化できません(汗

ツリー構造だと子ノードへのポインタが一番大事な情報になっちゃいますね。
その場合ポインターと直前着手があれば盤面情報は不要になります。
一方で、ハッシュテーブル構造だと、子ノードポインタ不要で、キー(と衝突検出)
のために盤面情報が必須になります。

DB化するんならハッシュテーブルとかの方が向いていますよね。

自分はMCTSでツリーを作ったり消したりなので、ツリー型にしています。
shared_ptr使って、不要になったノードはシステム任せで自動的に削除して貰って
います。ハッシュテーブルだと、そう簡単にはいきませんね。
159: 310 2017/12/17(日)00:21 ID:qILmYkkQ(1/2) AAS
ノートPCの冷却用(動作周波数に結構影響する)にUSB扇風機使ってましたが、
結構サイズでかくて持ち運び面倒だし、ノートPCのUSBポートに刺していると
安全装置が働いてしまうので、別途電源取っていました。

で、どうせ強化学習回しておくだけで暇だったので、専用のクーリングファンを
自作してみました。

タカチのアルミケースをぴったりサイズに切り欠いて、USBコネクタと5Vの
クーリングファンをセット。ノートPCに装着するとファンが回って冷却開始。
製作時間1時間程度。材料費は3000円くらい。

雑に作った割にはうまくできた。
160: 310 2017/12/17(日)02:09 ID:qILmYkkQ(2/2) AAS
EigenのSparseMatrixのサイズ制限を変える方法が見つかりました。

現在、簡易版と詳細版の2種類の評価関数を学習していますが、
これにより詳細版を完全にBuroさんモデルにする事ができるように
なりました。

というわけで、詳細版は再度学習し直しです。

簡易版は、多少癖があるようだけど、そこそこまともになっています。
一方、詳細版は何度もやり直し中(汗
1-
あと 842 レスあります
スレ情報 赤レス抽出 画像レス抽出 歴の未読スレ

ぬこの手 ぬこTOP 0.017s