[過去ログ]
【オセロ,将棋】ボードゲーム【囲碁,War】 (1002レス)
【オセロ,将棋】ボードゲーム【囲碁,War】 http://mevius.5ch.net/test/read.cgi/gamedev/1057763418/
上
下
前次
1-
新
通常表示
512バイト分割
レス栞
抽出解除
レス栞
このスレッドは過去ログ倉庫に格納されています。
次スレ検索
歴削→次スレ
栞削→次スレ
過去ログメニュー
453: 406 [sage] 2016/07/02(土) 23:40:37.16 ID:qo9Pciu3 なんか文字化けしてんなぁ なんでだ? まあいいか http://mevius.5ch.net/test/read.cgi/gamedev/1057763418/453
531: 名前は開発中のものです。 [sage] 2016/09/05(月) 22:36:42.16 ID:omFelghI remi coulomの書いたMM法のコード見つけたが難しくて読めないorzorzorz 頑張って読むか http://mevius.5ch.net/test/read.cgi/gamedev/1057763418/531
579: 名前は開発中のものです。 [sage] 2016/10/02(日) 19:09:19.16 ID:8lzQrfNi 完全ソルバと対戦させると誤った学習をしてしまってるように見えます。 悪い手を良い手と思ってる。 うーん。 学習量が足りないだけなんだろうか? http://mevius.5ch.net/test/read.cgi/gamedev/1057763418/579
680: 310 [sage] 2016/12/27(火) 01:58:53.16 ID:lSRXuhfg uctの探索部分がある程度できたので、とりあえずDOS窓ベースでゲームとして成り立つ ようにしました。edax-pvbook_2009.wtbから作った40手分の定石DBをつけて、終盤探索 は40手目からsolverで。multi probe cutできないので、FFO#40で1.3秒程度の性能です。 その他諸々。探索時間延長とか。タイマーを作り直してプログレスバーつけたり。 WZebraの20手読み、定石DB変化大相手に、まれに勝ちます。直接対決はまだして ませんが、以前自分が作ったmin-Max版よりちょっと弱いくらいかなという感触です。 モンテカルロは乱数がらみで、ナチュラルに変化しちゃうので、5〜10手に1回程度は ミスをしちゃう感じです。 プレイアウトはもう少し詰められそうだけど、まあこの辺が潮時かなぁ。 次は何しようかな。 http://mevius.5ch.net/test/read.cgi/gamedev/1057763418/680
781: 310 [sage] 2017/04/01(土) 14:20:36.16 ID:Wq4mpDtN ZebraをBook無しにして対戦したら、中盤で読み勝って+2勝ちになりました。 以下棋譜。 F5 D6 C3 D3 C4 F4 C5 B3 C2 E3 D2 C6 B4 B5 F2 E6 F3 C1 A3 A4 A5 A6 A7 D1 B6 E2 E7 D7 F1 E1 A2 G1 F7 G5 G4 G6 F6 H3 E8 C8 D8 G3 B8 B7 H5 H7 G2 H1 H6 G8 B1 A1 A8 C7 G7 H4 B2 H8 H2 F8 Zebra設定:白番、中盤24手探索、Book未使用、中盤変化せず 当方設定:黒番、10手目まで引分定石使用、思考時間1分、バックグラウンド探索なし 注)昨夜評価関数の学習を少し進めました。多分誤差範囲です。 Zebraの解析によれば23手目あたりで間違えてくれたみたいです。 こちらは10手までは定石使っておかないと、かなり滅茶苦茶な手を打ってしまったり しますので、Zebraの序盤の精度は凄いですね。 次はどうしよう。 強化学習を調べているんだけど、いまいちどう応用したら良いのかがわからない。 http://mevius.5ch.net/test/read.cgi/gamedev/1057763418/781
785: 310 [sage] 2017/04/03(月) 20:36:38.16 ID:BqB2rFYT パスがおかしくなる奴は、やはりデバッグルーチン限定で、かつ直すと本処理にも 大きな修正が必要になるので、当該デバッグ処理を削除して対処。 F5D6C4G5系をテストプレイしていてわかったのは、中盤ことごとく読みがZebraと 一致しない事。一致しないだけなら良いけど、そこがところどころ悪手になってるっぽい。 読みが一致しないと、事前に読んでいない枝で探索する事になり、浅い探索のまま 間違いが連鎖する感じ。Zebraの着手は、こちらAIが予想は評価値順で3番目以降に なっている。 これ、ロールポリシーが決めるプレイアウト割り当ての優先順位の問題か、それとも プレイアウトの精度の問題か、はっきりしませんが、要するに評価値が間違っている =弱いという事ですね。 で、この2点について、もう1ステップ先に進んでみようかと思います。 プレイアウトについては、強化学習で良いヒューリスティックを作れないか検討。 ロールポリシーについては、与えている棋譜のバラつきが原因かも知れないので、 強化学習の棋譜から自動生成する事を検討。 あと、終盤40手以降はほぼ間違えないので、Solverを削除してしまいました。 また、できれば、最終的には定石も無しにしたくなって来ました。 目指せピュアMCTS。 http://mevius.5ch.net/test/read.cgi/gamedev/1057763418/785
803: 535 [sage] 2017/04/25(火) 21:31:44.16 ID:I7r6uvd5 あ〜なんか新しいことすんの億劫だな。 プログラミングは少し充電期間をおいて本でも読もうかな。 http://mevius.5ch.net/test/read.cgi/gamedev/1057763418/803
993: 535 [sage] 2017/10/13(金) 22:13:12.16 ID:XE+Je04C >995踏んだあたりで次スレ建てましょう。 了解です。 >mnistは動かしたけど、examplesは文字通り構文サンプルとしてしか見てなかったかも。 なんかnum_hidden_unitsは定義されてるんですが定義される前に参照してるみたいですね。 順番入れ替えたらコンパイル通りました。 http://mevius.5ch.net/test/read.cgi/gamedev/1057763418/993
メモ帳
(0/65535文字)
上
下
前次
1-
新
書
関
写
板
覧
索
設
栞
歴
スレ情報
赤レス抽出
画像レス抽出
歴の未読スレ
AAサムネイル
Google検索
Wikipedia
ぬこの手
ぬこTOP
0.036s