[過去ログ]
【オセロ,将棋】ボードゲーム Part2【囲碁,War】 (1002レス)
【オセロ,将棋】ボードゲーム Part2【囲碁,War】 http://mevius.5ch.net/test/read.cgi/gamedev/1508056498/
上
下
前
次
1-
新
通常表示
512バイト分割
レス栞
このスレッドは過去ログ倉庫に格納されています。
次スレ検索
歴削→次スレ
栞削→次スレ
過去ログメニュー
19: 名前は開発中のものです。 [sage] 2017/10/26(木) 09:53:53.13 ID:43FvyXwK >>17 mnistは、分類器(他クラス分類)なので、活性化関数はsoftmaxになり、教師データ はlabel_tで与えます。別にvec_tでも良いですが、例えば3という答えに対して、 label_tは{3}なのに対し、vec_tは{0,0,0,1,0,0,0,0,0,0}などとなって冗長なので、label_tが 用意されているわけです。他にも、誤差の計算方法が違うなんてのもあります。 一方、ゲームの勝敗予想は2値分類問題なので、活性化関数はsigmoidで、教師 データはvec_tとして、勝利を{1}、敗北を{0}
として与えて学習させます。 オセロには引き分けがあるので、引き分けは{0.5}としてみましたが、勝率50%と引き 分けでは意味がまったく違うのが悩みの種です。2人ゼロ和完全情報ゲームでは 勝率50%というのは理論上存在しないのですが、強化学習の途中などでは生じます からね。 なお、tiny_dnnでは2値分類や回帰の学習には入力データも教師データもともにvec_t で与えてfitを用い学習します。mnistのような他クラス分類でlabel_tで教師データを与え、 学習をする時はtrainを使用します。 http://mevius.5ch.net/test/read.cgi/gamedev/150
8056498/19
20: 名前は開発中のものです。 [sage] 2017/10/26(木) 09:55:34.54 ID:43FvyXwK × 他クラス分類 ○ 多クラス分類 ですね。IMEのアホたれ(汗 http://mevius.5ch.net/test/read.cgi/gamedev/1508056498/20
21: 535 [sage] 2017/10/26(木) 21:09:13.33 ID:vVm7O/8N おおーありがとうございます。 trainの代わりfitってのがあるんですね。 ドキュメント読もうとしても英語ということを差し引いても 気が散っちゃって目が滑っちゃってどうにも駄目です。 試してみます。 http://mevius.5ch.net/test/read.cgi/gamedev/1508056498/21
22: 名前は開発中のものです。 [sage] 2017/10/26(木) 22:02:22.81 ID:/MbW7Vlw CNNの例題は大抵が多クラス分類問題ですからね。 説明がfit中心になりがちです。 つか、僕もかなり目が滑りました(汗 http://mevius.5ch.net/test/read.cgi/gamedev/1508056498/22
23: 535 [sage] 2017/10/26(木) 23:07:10.48 ID:vVm7O/8N うお、コンパイル通ったけど不正終了するorz ネットワークの形が不整合起こしてるのかなぁ http://mevius.5ch.net/test/read.cgi/gamedev/1508056498/23
24: 535 [sage] 2017/10/26(木) 23:47:16.17 ID:vVm7O/8N 動いた! 入力の形がおかしかったみたい。 http://mevius.5ch.net/test/read.cgi/gamedev/1508056498/24
25: 535 [sage] 2017/10/27(金) 00:51:01.21 ID:DjbLG1y4 cross_entropyだと動くのにmseだと落ちる 完全に意味不明 http://mevius.5ch.net/test/read.cgi/gamedev/1508056498/25
26: 535 [sage] 2017/10/27(金) 01:02:07.81 ID:DjbLG1y4 cross_entropyでも動かなくなったw なんなのwww もう寝る http://mevius.5ch.net/test/read.cgi/gamedev/1508056498/26
27: 名前は開発中のものです。 [sage] 2017/10/27(金) 01:02:52.52 ID:3GgMcLzr その辺まで来ると記憶があやふやに(汗 でも落ちた記憶はないかなあ。 http://tiny-dnn.readthedocs.io/en/latest/how_tos/How-Tos.html#handle-errors この辺の参考にしてcatchしてエラーの内容表示してみました? http://mevius.5ch.net/test/read.cgi/gamedev/1508056498/27
28: 名前は開発中のものです。 [sage] 2017/10/27(金) 01:34:38.06 ID:3GgMcLzr rollout無しにして探索速度がかなり上がったのですが、10手目近辺には ツリーの深さが50手まで達してしまいまして、今度はスワップとの闘いに なりつつあります。探索幅をケチればスワップは回避できるのですが、 そうすると読み漏れが・・・。 8ギガ程度じゃこの速度を活かせません(汗 http://mevius.5ch.net/test/read.cgi/gamedev/1508056498/28
29: 310 [sage] 2017/10/27(金) 09:09:34.47 ID:InThdIzI あれれ。また名前が消えていた(汗 お分かりの通り、今のところ名無しは310です。 http://mevius.5ch.net/test/read.cgi/gamedev/1508056498/29
30: 535 [sage] 2017/10/27(金) 21:44:23.84 ID:DjbLG1y4 なんかキャッチできたみたいです。 bad allocation だそうです。 いまはmain全体をtryでくくっているのでどこで例外が出ているのかよくわからないですね。 まずはそこの絞り込みですかね。 http://mevius.5ch.net/test/read.cgi/gamedev/1508056498/30
31: 535 [sage] 2017/10/27(金) 22:06:52.63 ID:DjbLG1y4 なんかスタックオーバーフローっぽい。 http://mevius.5ch.net/test/read.cgi/gamedev/1508056498/31
32: 535 [sage] 2017/10/27(金) 22:12:35.89 ID:DjbLG1y4 盤面のデータをvectorに突っ込んで返す関数があるのですが、 盤面のデータがでかすぎるってことみたいですね。どうやら http://mevius.5ch.net/test/read.cgi/gamedev/1508056498/32
33: 535 [sage] 2017/10/27(金) 22:13:39.78 ID:DjbLG1y4 >>27 解決したみたいです。 ありがとうございました。 助かりました。 http://mevius.5ch.net/test/read.cgi/gamedev/1508056498/33
34: 535 [sage] 2017/10/27(金) 22:45:06.44 ID:DjbLG1y4 スタックオーバーフローじゃなくて32bitだとメモリが足りないってことみたい。 64bitでコンパイルしたら正常に動いたみたいです。 http://mevius.5ch.net/test/read.cgi/gamedev/1508056498/34
35: 535 [sage] 2017/10/27(金) 23:11:51.03 ID:DjbLG1y4 動いてるように見えるけどエポックが進んでも損失が変わらない。。。 何を間違えてるんだろう? http://mevius.5ch.net/test/read.cgi/gamedev/1508056498/35
36: 535 [sage] 2017/10/28(土) 01:11:42.69 ID:MUiBaiII ネットワーク少し複雑にしたら激遅になったorz. も〜ムカつく。 http://mevius.5ch.net/test/read.cgi/gamedev/1508056498/36
37: 535 [sage] 2017/10/28(土) 01:24:04.86 ID:MUiBaiII ん、これシングルスレッドで動いてるん? マルチスレッドに出来るのかな… もう今日は寝ます。 http://mevius.5ch.net/test/read.cgi/gamedev/1508056498/37
38: 310 [sage] 2017/10/28(土) 13:51:26.14 ID:rt9aGKVT ネットワーク1段増やすだけで信じられないくらい遅くなりますよね。 最初に十分に深くして学習させて、だんだん減らしながら適切な深さを 求めたいんだけど、この速度低下を考えると、本当に学習できるのか わからないままだんだん深くしていくしか無いというのが萎える点です。 スレッドについては、リソースモニターで確認するとわかりますね。 ヘッダのどこかに並列化の設定があったはずです。 コンパイラがVSならOpenMPのオプションを設定します。 コンパイラのオプションの方もOpenM
Pの設定をお忘れなく。 http://mevius.5ch.net/test/read.cgi/gamedev/1508056498/38
39: 535 [sage] 2017/10/28(土) 22:22:00.33 ID:MUiBaiII 一応マルチスレッドで動いてるみたいですけど、CPUが50%位しか行かないですね。 あと、エポックが進んでも損失が変わらない原因がさっぱりわからないorz. http://mevius.5ch.net/test/read.cgi/gamedev/1508056498/39
40: 535 [sage] 2017/10/28(土) 23:21:37.85 ID:MUiBaiII 畳み込み層の設定がおかしいみたい。 畳み込み層外したら損失減った。 http://mevius.5ch.net/test/read.cgi/gamedev/1508056498/40
41: 310 [sage] 2017/10/28(土) 23:37:15.46 ID:rt9aGKVT CPU使用率はそんなもんかも。 ヘッダの話、Eigenとごっちゃになってるかも。 強化学習ですが、徐々に進んでいます。もっと早くSMORMS3にしとけば良かった。 終盤読み切りのソート順に評価値を使用しているのですが、目に見えて速度が 上がってきています。また自己対局の精度も上がってきたようで、遡りチェックで 30手まで何度か行きました。逆に記譜収集の方は、スコアのばらつきが無くなって きて、記譜的に良い事なのか不安。 というわけで、手ごたえを感じつつ、現状に合わせて若干
設定変更。 http://mevius.5ch.net/test/read.cgi/gamedev/1508056498/41
42: 535 [sage] 2017/10/29(日) 00:36:11.21 ID:zJx7nuOS なんか畳み込みにこだわらなくても全結合でも結構いい線いきそうな? まあ試しに全結合で進めてみるか。 http://mevius.5ch.net/test/read.cgi/gamedev/1508056498/42
43: 535 [sage] 2017/10/29(日) 18:55:23.53 ID:zJx7nuOS AIに組み込んでみましたが全く強くなってないですw そういえば、ライフゲーム囲碁はDBつかっても強くならないんだったww 囲連星に転進するか… http://mevius.5ch.net/test/read.cgi/gamedev/1508056498/43
44: 535 [sage] 2017/11/01(水) 00:19:41.19 ID:M72WSH0d 囲連星のDB全部vec_tに変換したらメモリパンクした^^ 学習しないな俺w マジでスレッドリッパーに128GB積みたい気分 http://mevius.5ch.net/test/read.cgi/gamedev/1508056498/44
45: 535 [sage] 2017/11/01(水) 00:42:51.08 ID:M72WSH0d データ減らしたら動き始めました。 でも遅いな〜こりゃそう簡単には終わらんぞorz. まあ今晩一晩流してみますが… http://mevius.5ch.net/test/read.cgi/gamedev/1508056498/45
46: 310 [sage] 2017/11/01(水) 01:06:46.90 ID:FDjtq7R7 バラして部分づつ学習する手もあるかも。 あ、元データはランダムに並び替えた方が良いですよ。 わかってると思いますが。 こちらは、しばらく強化学習していたら、それなりに学習が進んだ結果、 対戦相手側の手のばらつきが足りなくなって、局所解に陥ってた感じ。 急きょばらつきを広げて学習再開させたところです。 バリューの方は地道に損失が減っているんだけど、ポリシーの損失が 増えてきた。ポリシーはsigmoidがあるので、ウェイトが絶対値でとてつも なく大きくなって、なかなか
修正しきれない状況になってるかもしれない。 一旦リセットすべきか悩み中。 http://mevius.5ch.net/test/read.cgi/gamedev/1508056498/46
47: 535 [sage] 2017/11/01(水) 19:51:55.33 ID:M72WSH0d 1エポック5000秒、しかも損失があんまり減っていかないorz これはかなり厳しい http://mevius.5ch.net/test/read.cgi/gamedev/1508056498/47
48: 535 [sage] 2017/11/01(水) 20:00:50.18 ID:M72WSH0d ネットワークの大幅な簡素化が必要か? でも今のネットワークでも損失が減っていかないところを見るとそれも望み薄かなぁ http://mevius.5ch.net/test/read.cgi/gamedev/1508056498/48
メモ帳
(0/65535文字)
上
下
前
次
1-
新
書
関
写
板
覧
索
設
栞
歴
あと 954 レスあります
スレ情報
赤レス抽出
画像レス抽出
歴の未読スレ
Google検索
Wikipedia
ぬこの手
ぬこTOP
0.021s