[過去ログ]
【オセロ,将棋】ボードゲーム【囲碁,War】 (1002レス)
【オセロ,将棋】ボードゲーム【囲碁,War】 http://mevius.5ch.net/test/read.cgi/gamedev/1057763418/
上
下
前次
1-
新
通常表示
512バイト分割
レス栞
抽出解除
レス栞
このスレッドは過去ログ倉庫に格納されています。
次スレ検索
歴削→次スレ
栞削→次スレ
過去ログメニュー
401: 310 [sage] 2016/02/20(土) 13:43:08.30 ID:ZGi2V8ih GUIできた。昔作った序盤定石部分と合体。 中盤探索を反復深化にして、3秒を超えて新しい深さに入らないあたりで調整。 MPCで25手くらいまで読めるように調整。 終盤完全読みは38手から。36手からMPC付で完全読み(つまり完全ではない)。 こんな感じでできたので、早速プレイ。自分だと軽く全滅負けしてしまうので、zebra先生 にお越しいただきました。が、滅茶苦茶弱い。 良く見ると、定石が効いている段階で+16だったのが、中盤読みになった瞬間に一気に −14くらいまで落ちて、そのまま挽回できない感じ。zebra先生は、その前に定石から外れ て、既にzebraから見て+14程度の評価値を算出している。つまり、定石部分がおかしい。 それ以外は、評価値もzebraとは大きく違わないし、終盤探索もちゃんと機能している感じ。 http://mevius.5ch.net/test/read.cgi/gamedev/1057763418/401
418: 名前は開発中のものです。 [] 2016/03/11(金) 09:04:36.30 ID:HTdTU0Fi 浮上 http://mevius.5ch.net/test/read.cgi/gamedev/1057763418/418
670: 310 [sage] 2016/11/28(月) 13:44:46.30 ID:moEHPVOW >>669 やってみないとわからないけど、棋譜は質が良くて偏らないってのが基本だからね。 間違えたら間違えたなりに、負けてくれる棋譜じゃないと、変な学習しちゃうかも。 この辺の兼ね合いが難しい。 ただ、スタートの棋譜をその辺にして、だんだん更新しつつ、強くしていくって方法も あるかと思う。 こちらは、終盤探索に手こずっています。 AVX2命令をオペレーターオーバーロードして使っているのですが、グローバルなのが 気持ち悪くて、クラスに変更。ついでに見直しをしていたら、過去にどうしてもわからなくて 別の方法で逃げてしまったバグをようやく解消。速度には大した影響ないですが。 一番の問題は、評価関数を持っていないので、MPCが使えない事。MPCのスレッショルド を広げながら置換表使って、moveorderを最適化していたので。他の方法で速度アップを 考えないといけない。逃げてを考えると、結局、NNなりなんなりで別の評価関数なり、次の 1手ヒューリスティックが欲しくなります。もともとNN方面に行ったのは、そこが目的だった 事を思い出しました(汗 モンテカルロは、プレイアウトを疑っているので、いずれきちっとやり直してみます。 http://mevius.5ch.net/test/read.cgi/gamedev/1057763418/670
706: 535 [sage] 2017/01/26(木) 21:54:02.30 ID:NsrLS1+v 強い詰みルーチンが欲しいですねぇ。 DBでほぼ勝ちという局面にもっていってもポロッと落とすことが結構ある。 http://mevius.5ch.net/test/read.cgi/gamedev/1057763418/706
737: 310 [sage] 2017/02/20(月) 20:05:00.30 ID:L40mCRWI 論文自体はだいぶ前にダウンロードしてたんですが(汗 MCTSやらない段階では、やはり理解は難しかったと思います。 DCNN部分の投入データあたりは囲碁の知識が必要だったりしますので、 まだよくわからない点が多いです。 で、MCTS的な視点から眺めると、巷の解説とは違うところにフォーカスが あたったりします。強化学習使ったRL PolicyはValue netの事前学習で 使っていますが、プレイアウトの手の選択では線形Softmax、ノードの分岐 では教師付学習のものを使用しているなど、工夫が見られまして。オセロ は既に評価関数があるので、無理やりDCNNしなくても応用が効くのでは ないかと思ったりします。 とはいえ、今学習中の奴は、学習終わるまで1ヶ月くらいかかりそうではあり ますが、どこまで手の一致率が高められるか、見てみたい気もしています。 http://mevius.5ch.net/test/read.cgi/gamedev/1057763418/737
801: 310 [sage] 2017/04/23(日) 20:02:43.30 ID:Kquj3Rxt 色々係数調整したらめっちゃ弱くなって焦ってあちこちいじってました。 最初の調整の方向が逆だった模様で、反対に振ったら少し良くなりました。 過学習っぽい問題を何とかしたくて、ポリシーネットが作れないか、もう一度挑戦してます。 線形Softmaxでまた色々やっていたのですが、今まで上手く行かなかった理由が判明。 特徴を圧縮するのに…反転させたり回転させたりしていたので、盤面位置がわからなく なった投入データに対して、盤面との対応ができてる教師データと整合性が取れなく なっていたと…いまさら気づきまして…学習部分を全面的に作り直しとなっています。 なんて馬鹿な事をしていたんでしょう(涙 つまり、これが原因だったら、MLPも使えるかもって事です。 流石にDCNNは関係ないですが。 http://mevius.5ch.net/test/read.cgi/gamedev/1057763418/801
820: 名前は開発中のものです。 [sage] 2017/05/06(土) 09:20:21.30 ID:bJnH/Q0z そもそも将棋って、同種のゲームの中でAIにやらせるのは一番難しいくらいなんでしょ? もっと簡単なゲームからやってみては。 http://mevius.5ch.net/test/read.cgi/gamedev/1057763418/820
918: 310 [sage] 2017/07/29(土) 22:16:52.30 ID:YHqII1DK 遡りチェックの高速化で迷走中。 28手までなら問題なさそうなので、現在チェック中。 28手まで35分で遡れる記譜で29手目が1日経っても最善手か否かがわからない。 あまりに極端な差なので、何か条件があるのか、たまたまそういう記譜なのかを調べる ために、いったん28手まで遡れる記譜を探すという段取りです。 その間、PPLのキャンセル処理について、厳密に考えていたら、今のやり方ではベータ カットでのキャンセルが効いていないのではないかという疑念が。ループの中で再帰し ているので、そこにcancellation_token_sourceオブジェクトを渡してやって、ポーリングを して、下ノードでもキャンセル処理をしないといけないが、していなかったので結局中断 せずに、普通に終了待ちしてしまっているという事。 で、キャンセル処理を直したのだけど、時間変わらず。メッセージ出すようにしてデバッグ したところ、ベータカットが1件も起きていないという謎な事態が確認されました。出てくる 答えは合っているので、しばらく考えることになります。 http://mevius.5ch.net/test/read.cgi/gamedev/1057763418/918
928: 310 [sage] 2017/08/13(日) 23:11:58.30 ID:icrdxDk8 確定石とりあえずできました。 自分の実装で3ステップあるうちの2ステップでSIMD化できましたが、 最後の1つはまだシフトとループの組み合わせです。 で、さっそく敵確定石数からアルファ値アンダー検出のカットロジックを 入れてみましたが、遡りチェックに入れると、途中でバグるという状態。 しばし長考が必要です。 というわけで、記譜集めに戻りましたが、こちらもランダム着手付 の探索で、稀に間違った着手をするというバグが出てます。こちら も、しばし長考が必要かもしれません。 むむむ。 http://mevius.5ch.net/test/read.cgi/gamedev/1057763418/928
957: 310 [sage] 2017/09/24(日) 01:47:25.30 ID:1rFk/uJ5 強化学習は、適当にコーディングして結果からデバッグしているので時々不安になり ますが、それなりに学習してくれているみたい。学習内容は同じく勝率で、これをアル ファ碁で言うところのポリシーに使用してます。 強化学習のポリシーを導入した事で、遡りチェックも調子よく遡るようになり、最善手を 指している率が上がったように感じています。しょせん強化学習だし、まだ学習しはじめ なので、精度は高くありませんが、使い方次第ではいける感じです。 強化学習続けたら、定石DBの代わりになるんじゃないかと期待。 しばらく学習フェーズになりますが、次はロールポリシーを改良したいかな。 http://mevius.5ch.net/test/read.cgi/gamedev/1057763418/957
997: 310 [sage] 2017/10/15(日) 17:01:24.30 ID:Y3hjOlZC あ、urlが2chだとNGワードになっちゃうので、5chにしてみたけど、リンクできず。 というか、どうも.scの方にスレ作ってしまったかも。 このスレもメッセージ同期していたので、気が付かなかった。 なんかわけわからん。 http://mevius.5ch.net/test/read.cgi/gamedev/1057763418/997
メモ帳
(0/65535文字)
上
下
前次
1-
新
書
関
写
板
覧
索
設
栞
歴
スレ情報
赤レス抽出
画像レス抽出
歴の未読スレ
AAサムネイル
Google検索
Wikipedia
ぬこの手
ぬこTOP
0.029s