[過去ログ] 【オセロ,将棋】ボードゲーム Part2【囲碁,War】 (1002レス)
上下前次1-新
このスレッドは過去ログ倉庫に格納されています。
次スレ検索 歴削→次スレ 栞削→次スレ 過去ログメニュー
101: 535 2017/11/25(土)23:11 ID:ekS5f4AB(2/4) AAS
ちょっと目先を変えて9路囲連星やってみようかな。
9路なら序盤DBだけで押し切れそうな気がするw。
102: 535 2017/11/25(土)23:33 ID:ekS5f4AB(3/4) AAS
310さんみたいに既存コード全捨てでやってみようかなぁ?
もう一度まっさらな気持ちになって…
103: 535 2017/11/25(土)23:53 ID:ekS5f4AB(4/4) AAS
まっさらな状態から書いてみようとしたけど、
めんどくさくなってすぐ昔のコード確認しちゃうw
駄目すぎるw
104: 310 2017/11/26(日)13:10 ID:kav93n5u(1/2) AAS
ソース喪失以外の時は、結構コピペしていますよw
書き直しの時は、たいていあちこちで使用しているクラスの構造変え
たりする類の後戻りが難しい変更加える時なので、中の関数は一緒です(汗
新しい評価関数は、だいぶ落ち着いてきましたが、遡り28手くらい
でタイムアウトになります。並べ替えに使っているので精度が上がる
と速度が速くなるのです。前は29手、調子が良い時は30手くらい
まで行っていたので、まだ精度が追い付いていないみたいです。
これでしばらく強化学習の具合見ながら待つだけになっちゃいました。
5×5の囲碁くらいならCNNで評価関数作れないかなぁとか、詰将棋を
作るならBitboardを2バイトに拡張しなきゃとか、悪い虫が疼き始めて
います。
105: 535 2017/11/26(日)21:08 ID:wxjv7tgm(1/3) AAS
後のコード書きやすいように柔軟性のある設計にするかゴリゴリの最適化を目指すか悩み中w
106: 535 2017/11/26(日)21:53 ID:wxjv7tgm(2/3) AAS
ああ、最適化の誘惑に駆られるw
107: 310 2017/11/26(日)22:28 ID:kav93n5u(2/2) AAS
僕が読んだ本では、
最適化するな。アルゴリズムを考えろ。
アルゴリズムなら桁単位で速度アップし、過去に行った最適化は無駄になる。
と言うよな事がトップに書いてあって、それ以来(自分の)読みやすさ優先にしている。
BITBOARDのAVX2命令とか、その辺でいくつかの関数のみ、ゴリゴリにしている。
とはいえ、その辺も一応アルゴリズムの範疇かなぁ。
演算子のオーバーロードとか関数で隠ぺいしているしね。
問題は、最初にクラスの構造とかあんまり考えてないので、あとでごちゃごちゃに
なってしまう事。それで何度か書き直ししている。
108: 535 2017/11/26(日)22:35 ID:wxjv7tgm(3/3) AAS
まあ、そのセオリーは私もどこかで聞いたことありますがw
アルゴリズムでの改善が行き詰まると結局泥臭い最適化に手を出すことにww
すでに一回実装したことのあるプログラムだしある程度勘所というか見通しは立つかなーと
109: 535 2017/11/27(月)23:15 ID:jINzvSI7(1) AAS
勢いでコード書きなおしてるけどテストするのが面倒くさいw
言ってもしょうがないけどw
110: 310 2017/12/01(金)20:29 ID:ONM9KZwZ(1) AAS
またしても問題発覚。
タイムアウトなどでキャンセルしたとき、探索途中の中途半端な評価値の置換表
が作成されている模様。対象の特定はできないため、置換表データをいったん
削除して、全データに対して再度遡りチェックを実施する事で、置換表データを
再作成する事にしました。
むむむ。
評価関数はそれなりの精度になっているので、それなりの速度ではチェックできる
はずですが、またしても…って感じでがっかりです。
同一評価値で変化がある分、記譜は多少は膨れるはずなので、そちらに期待。
111: 535 2017/12/05(火)23:23 ID:CujvIJMm(1) AAS
9路囲連星、一応ルールと簡単なモンテカルロAIはちゃんと動いたっぽいです。
ここからどう展開するか。
112: 310 2017/12/05(火)23:36 ID:5HB6IIYO(1/2) AAS
とりあえず軽く遡りチェック完了。28〜30まで遡ると時間かかるので当面25前後まで。
もっとも誤着手なしタイムアウト無しだと30手だろうと遡れちゃうから、28手あたりの
適度なところで止めちゃいましたが。
で、置換表データ激減。いままで間違ったものを相当学習に取り込んでいたっぽい。
あと、MCTSのツリーの末端(以後終盤探索しているので数値確定)の評価が時々
狂う問題がありまして、いつもではなかったので目をつぶってましたが、暇だった
ので着手。原因不明なれど、二重更新問題っぽかったので、ツリー部分のコード
を整理してみたところ、何故か治ってしまった模様。
本当に直っていたら自己対局の精度も少し良くなるはず。
つか、羽生永世7冠誕生ですね。
記譜みてみましたが、何が何だかわけわからんけどw
113: 310 2017/12/05(火)23:43 ID:5HB6IIYO(2/2) AAS
Buroさん型特徴の評価関数もそろそろ限界っぽいのと、今のままだと強化学習にも
かなり時間がかかるので、新しいパソコンが欲しくなってきました。やはりCNNに行く
しかないかもという事で。
ものは試しにi9-7980でパソコン組んだら幾らになるのか、ネットで見積もってみた
のですが…そっと閉じてしまいました(汗
クロック数とか見ると、10コア20スレッドくらいの奴が、一番よさそうな気がするんだ
けど、どうなんだろう。
114: 535 2017/12/06(水)00:45 ID:D/I5x6A8(1/7) AAS
メモリも山盛り積みたいですよね〜
GPGPUも考えられるし。
115: 535 2017/12/06(水)21:27 ID:D/I5x6A8(2/7) AAS
アルファ将棋爆誕w
116: 310 2017/12/06(水)21:37 ID:fJiMVswg(1/2) AAS
今見たorz
夢想段階にあったものをことごとく圧倒的な力量でやられてしまふ。
そのうち、5分でオセロ作ったよとか言われるんだろうなぁ。
学習と評価の実行が完全に二分された今となっては、
学習に使用するハード性能は正義だと思い知らされる。
117: 535 2017/12/06(水)21:39 ID:D/I5x6A8(3/7) AAS
グーグルのアルゴリズムはマジ万能なんですかね〜?
必要マシンパワーがあれですが、ムーアの法則が解決するでしょう。
118: 535 2017/12/06(水)21:49 ID:D/I5x6A8(4/7) AAS
そんなに万能ならライブラリとして公開してくれw
囲連星とライフゲーム碁を学習させたいww
119: 535 2017/12/06(水)22:03 ID:D/I5x6A8(5/7) AAS
いっそ完全解析してくれたら諦めつくんですけどねw
120: 535 2017/12/06(水)22:49 ID:D/I5x6A8(6/7) AAS
9路囲連星のDB作りはじめました。
何日かぶん回そう。
121: 310 2017/12/06(水)23:02 ID:fJiMVswg(2/2) AAS
non-MonteCalroなツリー探索(勝手にそう呼んでる)は、MCTSがロールアウト
関数さえ作れれば万能なように、完全情報ゲームでは万能だと思う。
あと強化学習による評価関数の作成も。
ただ、まだAlpha碁Zeroの論文読んでないからわからないけど、CNNの入力
については、人間が介在しているかもしれない。少なくともアルファ碁の段階
では、ちょっと特殊な入力データを用意していた。
それと、完全情報ができない以上、強さの地平線を広げたに過ぎないのも確か。
それを実現するために圧倒的なマシンパワーを使っているわけで。そのマシン
パワーを前提に、それを完全に活かせるアルゴリズムにしたってところが、評価
ポイントなのかもしれない。
かなり悔し紛れな評価だけどorz
122: 535 2017/12/06(水)23:52 ID:D/I5x6A8(7/7) AAS
ガンガンツリー展開して全部DBに突っ込んでたら意外と早くメモリがパンクした。
相変わらず学習しない俺w
しょうがないからDBに入れるのは序盤だけにするか。
123: 310 2017/12/07(木)00:22 ID:EKyZH2pF(1) AAS
Googleがやらかしてから、後だしで俺も考えていたとか悔しいので、
前から思っている事をボソっと書いとく。
十分に深いDCNNの場合、表現の自由度が高いから、強化学習を繰り返す
事で過学習になる事が、起こりうる局面の大半を内部に保持する事につな
がっていて、実は汎化性能ガン無視で良いのではないか。起こりにくい局面の
評価値はグチャグチャでも構わないという事で。
と思っていたりする。
124: 535 2017/12/07(木)00:55 ID:+QWWXInu(1/9) AAS
修正してみたけど、8プロセス並列で動かすと意外とまだメモリがきついな。
しょうがないから1プロセスだけで流すか。
125: 535 2017/12/07(木)01:11 ID:+QWWXInu(2/9) AAS
うーん、なんか同じ局面しか選ばなくなっちゃう。
これは致命的な欠陥だなぁ。
どうしよう?
126: 535 2017/12/07(木)01:18 ID:+QWWXInu(3/9) AAS
駄目だ分からん。
諦めて今日は寝よう。
127: 535 2017/12/07(木)20:11 ID:+QWWXInu(4/9) AAS
あ〜ツリーのノードに親ノードポインタ入れてなかったわw
変だと思ったw。
でも対称局面合流させちゃってるから親が一意にならないな。。。
どうしよう。。
128: 535 2017/12/07(木)20:23 ID:+QWWXInu(5/9) AAS
親ポインタは諦めてほかの方法でごまかそうw
129(1): 535 2017/12/07(木)21:27 ID:+QWWXInu(6/9) AAS
なんか、UCTって初期の探索で間違った結果出ると挽回するの凄い大変なのかね?
それこそ修正に指数的な試行が必要になっているような…
130: 535 2017/12/07(木)21:35 ID:+QWWXInu(7/9) AAS
おっと、なんか挽回してきたw
それはそうとして、メモリが欲しいですねぇ。1TBくらい
上下前次1-新書関写板覧索設栞歴
あと 872 レスあります
スレ情報 赤レス抽出 画像レス抽出 歴の未読スレ
ぬこの手 ぬこTOP 0.021s