[過去ログ] 【オセロ,将棋】ボードゲーム Part2【囲碁,War】 (1002レス)
上下前次1-新
このスレッドは過去ログ倉庫に格納されています。
次スレ検索 歴削→次スレ 栞削→次スレ 過去ログメニュー
85: 535 [sage] 2017/11/17(金) 23:58:50.71 ID:8tEb8SWm(1) AAS
やっぱ思考時間短いといろいろいいんだよなぁ。
モンテカルロは確かにある程度強さ出せるけど
遅いのどうやって克服していいかわからんし。
悩ましい。
86: 310 [sage] 2017/11/18(土) 20:23:37.47 ID:TwYSqk9E(1) AAS
やっぱスピードは万能ですよねぇ。
モンテカルロですが、評価関数ができたら、アルファ碁Zero方式で(汗
緩やかに読み筋を絞り込みながら、有望な手を深読みする形になります。
mlp版を試していますが、中間層を64にしたら、学習は良いのですが、
モンテカルロが劇遅になりました…。今、中間層8で強化学習していますが、
なんか早々と線形回帰と同様に飽和状態になってしまった模様。
速度的には8が限界な気がする。
途中まで線形回帰の強化学習記譜で学習させていて、同じような癖がついて
しまったのかもしれないので、今晩一晩まっさらから学習させてみようかな。
87: 310 [sage] 2017/11/19(日) 15:23:45.94 ID:O7LFJYCP(1) AAS
あちゃー。
学習がいまいち変に感じていたのは、これは恥ずかしくて言えないレベルの
仕様ミスでした。あれ?と思って、良く考えずに念のため追加したコードが
数か所。ことごとく悪さしていました。
数日損をしたなぁ。
88: 310 [sage] 2017/11/20(月) 22:18:43.00 ID:/GG7G9SR(1/2) AAS
ぎゃー。
評価関数に入れるデータの変換テーブルに間違い見つけた。
評価関数がいまいち収束しなかったのはこれが原因かも。
もともとの線形回帰版の時代から隠れていたものなので、
線形回帰版も計算し直しです。
というわけで、数日パーどころか1か月単位でパーですorz
89: 310 [sage] 2017/11/20(月) 22:23:13.40 ID:/GG7G9SR(2/2) AAS
申し遅れましたが、これにて評価関数は最初から計算しなおしです。
幸い、記譜が60件+遡り時の訂正前分100件ほどの合計160件と、
置換表から拾ったものが10万件単位でありますので、最近得ていた
感触だと、これをベースに強化学習で補えそうだというのが、
唯一の救いです。
90: 535 [sage] 2017/11/21(火) 23:12:52.06 ID:orTiLUyu(1) AAS
やっぱアルファ碁ゼロは理想形なんだよなぁ。
全てが理想的すぎる。
まあ必要計算資源があれですが。。
91: 535 [sage] 2017/11/23(木) 19:54:22.22 ID:5nKVQF7K(1/2) AAS
アルファ碁ゼロには興味あるが詳細情報は意外とWebで探すの大変ですね。
かといってネイチャー買うのも金もかかるし読んでも多分理解できないからなぁ。
でも終盤DBとかやってても全然成果あがらなさそうだし生きてて辛い。
92: 535 [sage] 2017/11/23(木) 21:16:22.89 ID:5nKVQF7K(2/2) AAS
囲碁ソフトにLeela Zeroというオープンなフリーソフトがあるそうな。
何か参考になるだろうか?
93: 310 [sage] 2017/11/23(木) 21:17:40.34 ID:A/JPNP9D(1) AAS
アルファ碁ゼロの論文はまだ読んでませんが、アルファ碁の正常進化ですよ。
自分はDeep Learningのところは「しかと」しているので、MCTSの進化形として
とらえてみると、まあ想像ですうが、当たり前の事を当たり前にやっただけかなぁ
と思っています。
それより大問題が…
また、評価関数の入力データ作るための変換に間違いを見つけてしまいました。
前回どころではない大きな間違いで、良くこの評価関数でそこそこ収束していたなぁ
というレベルの間違いでした。ソース喪失して書き直していたところから仕込まれて
いたんだと言う事で。
なんか入力いい加減でもそこそこな評価関数ができちゃう事にびっくり。
今度こそ大丈夫と信じて・・・
94: 535 [sage] 2017/11/24(金) 22:55:40.11 ID:QoCCcG2C(1/3) AAS
なんかleela zeroのreadme読んでみたけど、一般人が買えるハードウェアだと
アルファ碁zeroの強さを再現するのに1700年トレーニングしなきゃならんとかw
は〜絶望するわ。
95(1): 535 [sage] 2017/11/24(金) 23:04:07.44 ID:QoCCcG2C(2/3) AAS
結局、仮に大金つっこんでスレッドリッパーとか買ったとしても到底無理ってことじゃん。
まあ、まったくの無駄になるとは思わないけど。
96: 535 [sage] 2017/11/24(金) 23:04:57.72 ID:QoCCcG2C(3/3) AAS
なんかIDにCがいっぱいあるな。
97: 310 [sage] 2017/11/25(土) 00:38:47.57 ID:Dx7Nr2Ji(1/3) AAS
もういっちょ間違い発見orz
ソース喪失後焦って数日でパーッと書いて、そのまま学習させて、そこそこ
収束していたから放置していたのを思い出してきた。今度は全部チェックした。
しかし、いい加減な評価関数でも、結構収束していたってのが凄いな。
そこはかとなく表現力不足を感じていたのはその辺が原因かなぁ。
記譜と置換表データで1から学習させるのに、一気に500回学習させたら、
思いっきり過学習になってしまった。現在、強化学習で解きほぐし中。
回帰の方はほぼほぐれたけど、MLPの方はまだ時間がかかりそう。
98: 310 [sage] 2017/11/25(土) 00:54:30.38 ID:Dx7Nr2Ji(2/3) AAS
>>95
某スレをウォッチしていたら、前から気になっていた事を指摘していた人がいた。
スレッドリッパーはAVX2命令の中に遅いものがあって、一つ下のインテルの奴の
方が、この手の計算は速いらしい。
あと、GPUをどう使うかだね。
けど学習だけならTensor Flowにやらせちゃえばよいのだろうけど、学習データを
使うところまで行ったら、GPU使った非同期並列処理とか考えなきゃならないし。
CUDAだっけ?GPU専用にコード書かないといけないし。
なんか道筋というか、そこまでやってる自分の姿がイメージしきれない(汗
その前に詰将棋を解くプログラム開発してそう(笑)
99: 535 [sage] 2017/11/25(土) 01:01:08.99 ID:ekS5f4AB(1/4) AAS
某スレってどこですか?
GPGPUはもうちょっとハードル下がってほしいですねぇ
CPUよりも何十倍も速くなるケースもあるらしいし興味ありますね
CUDAをごりごり書くのは難しそうですがライブラリとかに期待。
100: 310 [sage] 2017/11/25(土) 01:26:03.49 ID:Dx7Nr2Ji(3/3) AAS
コンピュータ囲碁か何かのスレです
この1か月くらいのカキこのどこかにありました(汗
101: 535 [sage] 2017/11/25(土) 23:11:08.18 ID:ekS5f4AB(2/4) AAS
ちょっと目先を変えて9路囲連星やってみようかな。
9路なら序盤DBだけで押し切れそうな気がするw。
102: 535 [sage] 2017/11/25(土) 23:33:24.64 ID:ekS5f4AB(3/4) AAS
310さんみたいに既存コード全捨てでやってみようかなぁ?
もう一度まっさらな気持ちになって…
103: 535 [sage] 2017/11/25(土) 23:53:52.98 ID:ekS5f4AB(4/4) AAS
まっさらな状態から書いてみようとしたけど、
めんどくさくなってすぐ昔のコード確認しちゃうw
駄目すぎるw
104: 310 [sage] 2017/11/26(日) 13:10:07.09 ID:kav93n5u(1/2) AAS
ソース喪失以外の時は、結構コピペしていますよw
書き直しの時は、たいていあちこちで使用しているクラスの構造変え
たりする類の後戻りが難しい変更加える時なので、中の関数は一緒です(汗
新しい評価関数は、だいぶ落ち着いてきましたが、遡り28手くらい
でタイムアウトになります。並べ替えに使っているので精度が上がる
と速度が速くなるのです。前は29手、調子が良い時は30手くらい
まで行っていたので、まだ精度が追い付いていないみたいです。
これでしばらく強化学習の具合見ながら待つだけになっちゃいました。
5×5の囲碁くらいならCNNで評価関数作れないかなぁとか、詰将棋を
作るならBitboardを2バイトに拡張しなきゃとか、悪い虫が疼き始めて
います。
105: 535 [sage] 2017/11/26(日) 21:08:25.02 ID:wxjv7tgm(1/3) AAS
後のコード書きやすいように柔軟性のある設計にするかゴリゴリの最適化を目指すか悩み中w
106: 535 [sage] 2017/11/26(日) 21:53:28.37 ID:wxjv7tgm(2/3) AAS
ああ、最適化の誘惑に駆られるw
107: 310 [sage] 2017/11/26(日) 22:28:47.97 ID:kav93n5u(2/2) AAS
僕が読んだ本では、
最適化するな。アルゴリズムを考えろ。
アルゴリズムなら桁単位で速度アップし、過去に行った最適化は無駄になる。
と言うよな事がトップに書いてあって、それ以来(自分の)読みやすさ優先にしている。
BITBOARDのAVX2命令とか、その辺でいくつかの関数のみ、ゴリゴリにしている。
とはいえ、その辺も一応アルゴリズムの範疇かなぁ。
演算子のオーバーロードとか関数で隠ぺいしているしね。
問題は、最初にクラスの構造とかあんまり考えてないので、あとでごちゃごちゃに
なってしまう事。それで何度か書き直ししている。
108: 535 [sage] 2017/11/26(日) 22:35:57.72 ID:wxjv7tgm(3/3) AAS
まあ、そのセオリーは私もどこかで聞いたことありますがw
アルゴリズムでの改善が行き詰まると結局泥臭い最適化に手を出すことにww
すでに一回実装したことのあるプログラムだしある程度勘所というか見通しは立つかなーと
109: 535 [sage] 2017/11/27(月) 23:15:23.55 ID:jINzvSI7(1) AAS
勢いでコード書きなおしてるけどテストするのが面倒くさいw
言ってもしょうがないけどw
上下前次1-新書関写板覧索設栞歴
あと 893 レスあります
スレ情報 赤レス抽出 画像レス抽出 歴の未読スレ AAサムネイル
ぬこの手 ぬこTOP 0.017s