[過去ログ]
【オセロ,将棋】ボードゲーム Part2【囲碁,War】 (1002レス)
【オセロ,将棋】ボードゲーム Part2【囲碁,War】 http://mevius.5ch.net/test/read.cgi/gamedev/1508056498/
上
下
前
次
1-
新
通常表示
512バイト分割
レス栞
このスレッドは過去ログ倉庫に格納されています。
次スレ検索
歴削→次スレ
栞削→次スレ
過去ログメニュー
621: 310 [sage] 2019/01/23(水) 01:56:46.43 ID:QHWWUXAJ 置換表に使ってるので要素数は現在残り28手で100万超える事もあります(汗 まあ、βカットの具合でだいぶ変わるので、学習進むと減るんですが。 最低でも残り30手まで行くつもりなので、1000万くらいは想定したいです。 次の一手ソート用の配列は、Array型にしています。32個確保すれば足ります。 こちらも比較したところ、明確に速度差がありました。この辺から、領域をチマチマ 確保されるオーバーヘッドが気になりだした次第です。 で、赤黒木ですが、実装が悪いのだと思いますが、現時点で2分木と比較して およそ3倍時間がかかります。シングル動作でも同じくらいの差になるので、 排他待ちではなく、木のつなぎ替え処理の重さが原因かなと。置換表は追加が の比率が大きいので、ポインタたどるロスは優位ではない感じ。 というわけで、赤黒木はちょっと放置。 というか、二分木もシングル動作は10倍くらい速い感じなので、今一度シングル 探索の並列化を試そうと思っています。 http://mevius.5ch.net/test/read.cgi/gamedev/1508056498/621
622: 310 [sage] 2019/01/23(水) 02:07:28.76 ID:QHWWUXAJ >>618 min-Max前提だと、探索値を求める際には勝率(点数)が必須で、 次の1手評価関数はオーダリングや前方枝刈向きではないですか? 探索深さ1なら次の1手で行けますが。 初代アルファ碁も、両方組み合わせていますが、次の1手評価関数で 手の優先順位をつける事で読み深さを実現した変則mctsで、最終的には 評価値で判断していますよね。 http://mevius.5ch.net/test/read.cgi/gamedev/1508056498/622
623: 535 [sage] 2019/01/23(水) 20:43:46.28 ID:B65SvCza ふーむ、勝率のほうが応用が利くってことですかね? もうしばらく勝率で学習させてみます。 http://mevius.5ch.net/test/read.cgi/gamedev/1508056498/623
624: 535 [sage] 2019/01/23(水) 21:07:20.14 ID:B65SvCza ついネットワークを大きくしたくなっちゃうけど。 本当は小さいネットワークでエポック数を稼いだほうがいいのかもしれない。 http://mevius.5ch.net/test/read.cgi/gamedev/1508056498/624
625: 535 [sage] 2019/01/23(水) 21:28:27.72 ID:B65SvCza そういえば、対称局面も学習データとして使ったほうがいいんでしたっけ? http://mevius.5ch.net/test/read.cgi/gamedev/1508056498/625
626: 310 [sage] 2019/01/24(木) 01:32:42.88 ID:cGqmeFv+ 囲連星は初期配置ないんでしょ? だったら対象局面ありの方が良いと思う。 オセロは悩み中。 初手をF5固定にした時に、本当に対称局面が出てくるのかわからない。 対称局面が同じ重要性で生じないのであれば、評価値を希釈しちゃうだけ。 学習の時間も単純に倍々で増えるので、今はやっていない。 強いて言うなら、F5F6E6の次がF4とD6で斜め対称になるので、ここだけは 記譜作成時にはF4固定にして、D6の対称局面を作っている。 http://mevius.5ch.net/test/read.cgi/gamedev/1508056498/626
627: 310 [sage] 2019/01/24(木) 01:49:46.37 ID:cGqmeFv+ 置換表自作の件、目的を見失っている(汗 一旦リセットして、最初からやり直して、当初の目的に戻ろうと思うorz http://mevius.5ch.net/test/read.cgi/gamedev/1508056498/627
628: 578 [sage] 2019/01/24(木) 01:53:14.72 ID:mzMMzuaC 私は教師データの数が8倍になるのは大きいと思って対称局面も入れて学習させてます とくにDeep Learningさせてると(ネットワークの規模にもよりますが)だいぶ過学習しなくなります もっとも、Deep Learningするんだったら対称性を考慮したネットワークにしたほうがいいのかもしれないですが・・・ http://mevius.5ch.net/test/read.cgi/gamedev/1508056498/628
629: 310 [sage] 2019/01/24(木) 02:08:25.51 ID:cGqmeFv+ 着手できる場所の自由度が高いゲームは回転させるべきだと思う。 オセロは着手可能場所が限られるので、現れない局面が結構ありそう。 ちなみに、オセロは8倍じゃなくて4倍。初期配置が4対称だから。 囲連星は初手天元固定なのかな? http://mevius.5ch.net/test/read.cgi/gamedev/1508056498/629
630: 578 [sage] 2019/01/24(木) 07:09:21.18 ID:mzMMzuaC >オセロは8倍じゃなくて4倍 たしかに棋譜で考えると4対称しか無いですね 今のところ、学習させるときには現局面しか渡してないので、 90度回転で一致する局面が存在するかもしれないから8倍で良いはず… http://mevius.5ch.net/test/read.cgi/gamedev/1508056498/630
631: 535 [sage] 2019/01/24(木) 22:03:23.55 ID:gSjgdU9w うーん。今のやり方だとLV0やLV1とはいい勝負になるけどLV3には一生勝てないかも? 出来れば自己対戦による強化学習とか取り入れたいな〜 対称局面もやってみますね。 http://mevius.5ch.net/test/read.cgi/gamedev/1508056498/631
632: 535 [sage] 2019/01/24(木) 22:45:59.18 ID:gSjgdU9w なんか長時間計算回してると画面が真っ暗になってマウスやキーボード押しても復帰しないことがあるんだが? スリープは解除してるはずなんだけどなんなんだろう? http://mevius.5ch.net/test/read.cgi/gamedev/1508056498/632
633: 535 [sage] 2019/01/25(金) 23:18:39.41 ID:gNQn5rdl LV0ってやっぱ棋力低いな。 そんなLV0といい勝負の俺のAIもあれだけど。 やればやるほどLV3の完成度の高さが際立つ。 http://mevius.5ch.net/test/read.cgi/gamedev/1508056498/633
634: 310 [sage] 2019/01/26(土) 17:00:37.38 ID:VyVaK4H+ 自作置換表ですが、大体のところがまとまりました。 結局のところ、unordered_mapを作っていた形になります(汗 当初は領域の追加について、データ部分をまとめて追加する方向で改造し、 ハッシュ配列については22ビット固定で、高速化をしました。で、ハッシュ配列が 22ビット固定は芸がないと、二分木・赤黒木などを試しましたが、速度大幅低下。 要するに、unordered_mapにmapを組み合わせて、ハッシュのメリットを相殺して しまっていたという事で。 最終的に、ハッシュ配列の追加方法をようやく思いつき、組んでみたところ、それが そのままunordered_mapのrehashだと気が付きました(汗。その後、max_load_factor などを追加して、unordered_mapと条件を揃えて速度比較となりました。 iteratorと削除が無い分だと思いますが、unordered_map、concurrent_unordered_map に対して、それぞれシングル版、concurrent版とも若干高速になりました。 新たな課題は…stlも自作版も、どちらも並列に動かしたconcurrent版の方が遅いと 言う事です。もともとそういうものなのか…テスト方法が並列向けじゃないのか。 http://mevius.5ch.net/test/read.cgi/gamedev/1508056498/634
635: 535 [sage] 2019/01/26(土) 17:38:15.71 ID:VGsbBdjp 8対称はメモリがやばいので4対称にします。 4対称で16GB位食ってる。 http://mevius.5ch.net/test/read.cgi/gamedev/1508056498/635
636: 535 [sage] 2019/01/26(土) 17:54:22.18 ID:VGsbBdjp 思い切っていいPC買ったけどまだ足りないとかorzorzorz ケチらず64GB積むべきだったか? http://mevius.5ch.net/test/read.cgi/gamedev/1508056498/636
637: 535 [sage] 2019/01/26(土) 18:59:37.97 ID:VGsbBdjp 1エポック4539秒 これは厳しいorzorzorz GPUが使えれば… http://mevius.5ch.net/test/read.cgi/gamedev/1508056498/637
638: 535 [sage] 2019/01/26(土) 19:45:15.05 ID:VGsbBdjp ん、1エポック目だけど損失がかなり少ない。。 対称局面を入力とすることで特徴量がよりはっきりしたということだろうか? http://mevius.5ch.net/test/read.cgi/gamedev/1508056498/638
639: 535 [sage] 2019/01/26(土) 19:46:56.43 ID:VGsbBdjp ん、動きが断然よくなってる? まだわからんが。 http://mevius.5ch.net/test/read.cgi/gamedev/1508056498/639
640: 535 [sage] 2019/01/26(土) 19:53:15.64 ID:VGsbBdjp 対称局面学習以前はどちらかというとランダムに近かったが 対称局面学習以後はどちらかというと知性があるっぽく見える。 まだわからんが。 http://mevius.5ch.net/test/read.cgi/gamedev/1508056498/640
641: 535 [sage] 2019/01/26(土) 20:02:51.02 ID:VGsbBdjp これでエポックが進めばとんでもなく強くなる? まだわからんが。 http://mevius.5ch.net/test/read.cgi/gamedev/1508056498/641
642: 535 [sage] 2019/01/26(土) 20:15:10.01 ID:VGsbBdjp マシンパワーが欲しい! Googleに匹敵するマシンパワーが! http://mevius.5ch.net/test/read.cgi/gamedev/1508056498/642
643: 535 [sage] 2019/01/26(土) 20:40:08.93 ID:VGsbBdjp まだLV3には遠く及ばないな。 でも希望が出てきた。 http://mevius.5ch.net/test/read.cgi/gamedev/1508056498/643
644: 535 [sage] 2019/01/26(土) 21:34:58.78 ID:VGsbBdjp 学習用、棋譜採取用、対戦統計用、開発用で4台マシンほしいw http://mevius.5ch.net/test/read.cgi/gamedev/1508056498/644
645: 535 [sage] 2019/01/26(土) 22:03:09.49 ID:VGsbBdjp やっぱ思考時間短いのはいいな。 モンテカルロは強いけど思考時間長すぎたからな。 http://mevius.5ch.net/test/read.cgi/gamedev/1508056498/645
646: 535 [sage] 2019/01/26(土) 23:04:44.42 ID:VGsbBdjp 棋力が低すぎてすさまじい泥仕合になるの切ないorz http://mevius.5ch.net/test/read.cgi/gamedev/1508056498/646
647: 535 [sage] 2019/01/26(土) 23:32:04.39 ID:VGsbBdjp メモリがもっとあれば異なるネットワークを並列に学習とかもできたかもなぁ まさか32GBで足りないとは… http://mevius.5ch.net/test/read.cgi/gamedev/1508056498/647
648: 535 [sage] 2019/01/27(日) 14:58:44.29 ID:RY/5cpPz DNNの評価値とMM法の評価値の和で最終評価値を算出するようにしてみました。 多分DNNのみより強くなってます。 http://mevius.5ch.net/test/read.cgi/gamedev/1508056498/648
649: 535 [sage] 2019/01/27(日) 15:49:50.57 ID:RY/5cpPz 黒番で軽く動かしてみました。 10局目 黒(airandom.dll)の勝利回数: 8 白(ai-lv1.dll)の勝利回数: 2 まずまずの結果かな。 ちなみに白番はうまく動いてなくて1の1とか打っちゃうので途中で中断しました。 http://mevius.5ch.net/test/read.cgi/gamedev/1508056498/649
650: 535 [sage] 2019/01/27(日) 16:41:37.92 ID:RY/5cpPz うお、猛烈に追い上げられてるorz 悪くない手ごたえがあったと思いましたが… 25局目 黒(airandom.dll)の勝利回数: 15 白(ai-lv1.dll)の勝利回数: 10 http://mevius.5ch.net/test/read.cgi/gamedev/1508056498/650
メモ帳
(0/65535文字)
上
下
前
次
1-
新
書
関
写
板
覧
索
設
栞
歴
あと 352 レスあります
スレ情報
赤レス抽出
画像レス抽出
歴の未読スレ
Google検索
Wikipedia
ぬこの手
ぬこTOP
0.014s