[過去ログ] 【オセロ,将棋】ボードゲーム【囲碁,War】 (1002レス)
1-

このスレッドは過去ログ倉庫に格納されています。
次スレ検索 歴削→次スレ 栞削→次スレ 過去ログメニュー
838: 535 2017/05/30(火)22:08 ID:rOaQFKPq(1) AAS
囲連星における将棋で言うところの詰めろと必至を計算するルーチンが欲しい。
かなり切実に。
839: 310 2017/05/30(火)23:20 ID:rROdfu2T(1) AAS
バグ取りしながら、色々いじったら、バグとる前に別のバグを仕込んで・・・
と、長らくデバッグしてましたが、ようやくいじりたくなるところが収束し、バグが
とれて、学習が進むようになりました。

100ゲームプレイして学習のサイクル1回が4分弱になりましたので、
結構気持ちが楽になりました。とりあえず1週間くらい学習させてみます。

一通りできたら、ポリシーの方にもトライしてみようと思います。
840: 535 2017/06/01(木)22:33 ID:COhqrYJ6(1) AAS
棋譜から詰めろと必至になったパターンを抽出してDBを作ってみようかな。
841: 535 2017/06/02(金)22:15 ID:uf6z9S1Y(1) AAS
簡単に2手連打で必勝形ならば詰めろ、ということで仮組みしてみた。
どんな感じかな。

今度AMDからでるスレッドリッパーが気になってしょうがない。
842: 535 2017/06/03(土)00:14 ID:976t+GmL(1/2) AAS
詰めろルーチンなかなかいい感じ?
石の流れが良くなった気がする。

そろそろシチョウルーチンも書かないとだな。
843: 535 2017/06/03(土)18:55 ID:976t+GmL(2/2) AAS
現在LV3と対戦中ですがなかなかいい感じです。

13局目
黒(airandom.dll)の勝利回数: 9
白(ai-lv3.dll)の勝利回数: 4

11局目
黒(ai-lv3.dll)の勝利回数: 9
白(airandom.dll)の勝利回数: 2

白番でもうちょっと勝ちたいですねぇ
あと対戦にめちゃめちゃ時間かかるのがどうにも。
844: 535 2017/06/04(日)20:33 ID:55DsrXcK(1) AAS
黒番対LV3大きく勝ち越せるかと思ったけど、その後追いつかれちゃってがっかりして対戦止めちゃいました。
もう一工夫必要ですね。
845: 535 2017/06/05(月)00:12 ID:7uLLK55W(1/2) AAS
気を取り直してLV1,LV2と対戦中
なかなかいい感じ

19局目
黒(airandom.dll)の勝利回数: 19
白(ai-lv1.dll)の勝利回数: 0

17局目
黒(airandom.dll)の勝利回数: 16
白(ai-lv2.dll)の勝利回数: 1
846: 535 2017/06/05(月)19:22 ID:7uLLK55W(2/2) AAS
引き続き対戦中
なかなかいい感じ

40局目
黒(airandom.dll)の勝利回数: 39
白(ai-lv1.dll)の勝利回数: 1

37局目
黒(airandom.dll)の勝利回数: 36
白(ai-lv2.dll)の勝利回数: 1
847: 310 2017/06/05(月)19:52 ID:PVR4/NQn(1) AAS
強化学習にトライ中。
最初の勝敗をQ学習する方法は目に見えて学習できていそうだったのですが、
ネットワークが小さすぎたのか、比較的早い段階で飽和。ネットワークを深くして
再試行しようかと思ったのですが、せっかくなのでポリシーの学習にトライ。

しかし、Q学習と違って、学習が上手く進みません。
初期値問題かと思って、最初に教師あり学習をさせてみましたが、やはり勝率が
上がらないというか、30%近辺に落ち込んだまま浮かんでも50%くらいにしか
ならない感じ。このまま続けたら、どこかで戻ってくるのか。100対局の強化学習
で30分かかるので、どうしようかと。

Q学習の方は、比較的簡単に、対象のAIに勝てるようになっていて、世代の追加が
順調に進んでいました。ポリシーだと何故ダメなのか考えれば考えるほど、頭が
混乱してます。
848: 310 2017/06/06(火)20:05 ID:6owNcmqA(1/2) AAS
バグ見つけた。簡単かつ破壊力があるやつ。
教師あり学習の一致率が試行回数少ないのに85%とかになっていて
おかしいとは思っていたんだけど。教師付学習も強化学習も同じバグ。
自分の盤面のところに、次の着手(要するに教師データ)を入れてた。

というわけで、教師付学習からやり直しています。
雰囲気的には、今のネットワークで一致率50%近くまで行きそうです。

あと、GitHUBでAlpha Goクローンを作っているプロジェクトを発見。
解説ページで評価関数部分を結構細かく解説してくれています。

そこで、ポリシーネットの負けた側について「学習率をマイナス」にして
学習すると書かれていて(@o@)。こんなスマートな方法があったとは
やられました。
849: 535 2017/06/06(火)20:11 ID:7GjyRXFQ(1/3) AAS
>GitHUBでAlpha Goクローンを作っているプロジェクトを発見。

URLくだしあ
850: 535 2017/06/06(火)20:40 ID:7GjyRXFQ(2/3) AAS
外部リンク:github.com
これかな。
851
(1): 310 2017/06/06(火)20:47 ID:6owNcmqA(2/2) AAS
それだす。

一致率は45%で頭打ち。
時間かけずに一致率上げる工夫方面に転進します。
852: 535 2017/06/06(火)21:12 ID:7GjyRXFQ(3/3) AAS
>>851
ありがとうございます。

LV1とLV2,ホントは100戦づつしたかったけど時間かかりすぎるから止めました。
でもまあ手ごたえありの結果ですねぇ。
LV1とLV2は卒業といってもいいかも。

54局目
黒(airandom.dll)の勝利回数: 51
白(ai-lv1.dll)の勝利回数: 3

60局目
黒(airandom.dll)の勝利回数: 58
白(ai-lv2.dll)の勝利回数: 2
853: 535 2017/06/09(金)22:02 ID:N9z2bSO/(1/2) AAS
黒番対LV3で難解なコウ争いの末、辛くも勝利!
地力がついてきた!
それにしてもLV3の粘りには驚かされますね。

(;SZ[19]
;B[jj];W[ji];B[ki];W[ik];B[ii];W[jl];B[jh];W[hi]
;B[hh];W[gh];B[kk];W[gg];B[jg];W[kf];B[jf];W[je]
;B[ie];W[hj];B[id];W[hg];B[ig];W[ih];B[hf];W[ge]
;B[hh];W[ij];B[ic];W[ih];B[ke];W[ji];B[lf];W[kl]
;B[kg];W[jk];B[fg];W[lm];B[mn];W[kj];B[gf];W[lk]
;B[jd];W[mk];B[mf];W[ml];B[nm];W[nf];B[if];W[of]
;B[kf])
854: 535 2017/06/09(金)23:50 ID:N9z2bSO/(2/2) AAS
シチョウルーチン組んでたら根本的なルール部分にバグ発見。
出現頻度は低い奴だけどまだこんなバグ残ってんのかとビビった。
855: 310 2017/06/10(土)16:27 ID:PCeXyVVE(1) AAS
こちらはかなり迷走中。精度を求めるとCNN時間がかかりすぎ。

やっぱり、Buroさんの評価関数の特徴を入力にして、畳み込み演算を使用しない方向で
進めるのが吉ではないかと思い始めています。最終的にオセロAIの中で実用的な速度で
答えが出せるものでないと使い物にならないので。

Buroさん特徴型でポリシーが作れるか。
バリューに相当する勝率ネットワークを作った時、その勝率が使い物になるのか?
それらを強化学習で強化できるのか。

この辺に目標を切り替えます。

ちなみに、今のはBuroさん型評価関数の、評価値(終局時の石数差の予想)を、適当な
線形変換で−1〜1の勝敗の確率っぽい数字とみなして使用していますので、そこの
精度はよくなるのではないかと期待。
856: 535 2017/06/10(土)23:26 ID:L+AkmAT7(1) AAS
思考時間短縮策を考えているんですが、
まだ強さが十分じゃないのに思考時間短縮を考えるのは悪手な気もする。
でも思考時間かかりすぎると統計とれないし悩ましい。
857: 535 2017/06/11(日)21:28 ID:SJZps56X(1) AAS
やっぱハードを強化するしか…
AMDのスレッドリッパーあたり行っちゃうか?
858: 310 2017/06/11(日)23:00 ID:8gFXyRd+(1) AAS
Buroさん特徴型で2層パーセプトロン型のポリシー作って学習開始。
1エポック目でテストデータに対して正答率48%超え(汗
当然ながらスピードも速い。

やっぱBuroさん凄い。
859: 535 2017/06/12(月)20:43 ID:b/m4vK+x(1) AAS
序盤、いままでDBから一番勝利数の高い手を選んで打ってたけど、
それだと布石が限られちゃうからランダムで第二候補も打つようにしたら
若干勝率下がったような気がする。
まあしょうがないか。
860: 535 2017/06/13(火)21:33 ID:Vwv80HwJ(1) AAS
囲碁プログラムなんかだとKGS行くとモンテカルロ350プレイアウト位でも結構強いプログラムあるんだけど、
なんでそんな少ない回数で強さを出せるのか謎すぎる。
861: 535 2017/06/17(土)23:55 ID:RoY4moNt(1) AAS
あ〜アイディア湧かね〜
とりあえず LV3 vs LV3の棋譜取 回せるだけ回すか。
スレッドリッパーがあれば今の4倍速で棋譜収集できそうだが…
862: 535 2017/06/21(水)20:57 ID:jKeRi7uh(1/2) AAS
プロファイル取ろうとするとメッチャ時間かかる。
マルチスレッドだと特に時間かかるんだろうか?
プロファイル無しなら2分もかからんのにもう30分くらい走らせてる気がする。
863: 535 2017/06/21(水)21:22 ID:jKeRi7uh(2/2) AAS
将棋、連勝記録らしいですね。一位タイ?とかなんとか
864: 310 2017/06/22(木)17:10 ID:nCVESNnQ(1) AAS
昨日の大雨が原因か、ノートパソコンがダメっぽいです。サーフェースなので、SSDの中身が取り出せるか微妙。多分アウト。

という訳で、ソース全滅を半ば覚悟してます(>_<)

しばらく立ち直れないかも。
865: 535 2017/06/22(木)19:16 ID:1hrbCk1w(1) AAS
あちゃーご愁傷さまです
まあこれはあれですね
ハイスペックデスクトップを買えという
神のお告げですね
866: 310 2017/06/22(木)21:45 ID:qlJt6F9H(1) AAS
bitlockとかいうセキュリティ保護状態になったのですが、そんな設定してないのです。解除には、解除コードが必要なのですが、そんなの設定してないし。ディスク初期化すれば復活するとの事なので、諦めて初期化しちゃいました。

ビットハックしまくったコードなので、再度コーディングするの面倒です。

ソース保管のためにも、別のPC買うべかなぁ。
867: 535 2017/06/22(木)23:51 ID:OkW8ZbGj(1) AAS
そこはGitとか使えばいいんじゃないですかね〜
まあ公開するか金払うかしないとダメですが。
1-
あと 135 レスあります
スレ情報 赤レス抽出 画像レス抽出 歴の未読スレ

ぬこの手 ぬこTOP 0.024s