[過去ログ]
【オセロ,将棋】ボードゲーム Part2【囲碁,War】 (1002レス)
【オセロ,将棋】ボードゲーム Part2【囲碁,War】 http://mevius.5ch.net/test/read.cgi/gamedev/1508056498/
上
下
前
次
1-
新
通常表示
512バイト分割
レス栞
このスレッドは過去ログ倉庫に格納されています。
次スレ検索
歴削→次スレ
栞削→次スレ
過去ログメニュー
1: 名前は開発中のものです。 [] 2017/10/15(日) 17:34:58.03 ID:RaMh0le2 比較的地味なボードゲーム専用のスレが欲しくて立ててみました。 前スレ 【オセロ,将棋】ボードゲーム【囲碁,War】 http://mevius.2ch.net/test/read.cgi/gamedev/1057763418/ http://mevius.5ch.net/test/read.cgi/gamedev/1508056498/1
2: 535 [sage] 2017/10/16(月) 21:32:43.84 ID:nZcg7vL7 ここって書きこみないと落ちちゃうとかあるんでしたっけ? とりあえず、スレたて乙です。 http://mevius.5ch.net/test/read.cgi/gamedev/1508056498/2
3: 535 [sage] 2017/10/16(月) 22:46:32.02 ID:nZcg7vL7 どこかにtiny-dnnのまとまったドキュメントないですかね〜 とりあえずvec_tというのが何者かわからないorz. http://mevius.5ch.net/test/read.cgi/gamedev/1508056498/3
4: 名前は開発中のものです。 [sage] 2017/10/16(月) 22:57:12.10 ID:hLbjq5wm どもです。 強化学習ですが、まだまだ時間がかかりそうで、業を煮やして学習率あげたら、 バリューが発散してやり直し(汗 ちょっと工夫を加えて、強化学習を数回したら、MCTSで自己対戦して記譜作成。 記譜を見て学習の進捗を計りながら、過去に採取した記譜で軽く教師付き学習 させて、学習の方向性を補正しつつう、後半部分の精度を少しづつ上げて、強化 学習がはかどるようにしようとしてます。 というわけで、純粋な強化学習ではなくなってしまった。 http://me
vius.5ch.net/test/read.cgi/gamedev/1508056498/4
5: 535 [sage] 2017/10/16(月) 23:09:26.31 ID:nZcg7vL7 名前はどうしましょうかね〜 新スレだし310,535を名乗るのもなんですね… http://mevius.5ch.net/test/read.cgi/gamedev/1508056498/5
6: 名前は開発中のものです。 [sage] 2017/10/16(月) 23:10:47.72 ID:hLbjq5wm >>3 日本語紹介記事 https://qiita.com/nyanp/items/11c6bb6fb539486c5069 作者の実装ノート https://github.com/tiny-dnn/tiny-dnn/wiki/%E5%AE%9F%E8%A3%85%E3%83%8E%E3%83%BC%E3%83%88 英語 https://github.com/tiny-dnn/tiny-dnn/wiki http://tiny-dnn.readthedocs.io/en/latest/how_tos/How-Tos.html こんなの見てました。 vec_tについては、3番目のwikiのData-Format > https://github.com/tiny-dnn/tiny-dnn/wiki/Data-Format に、vector<double&
gt;であると書かれています。 なんちゃらparserってのは、外部のデータをtiny_dnnの内部形式である、 vec_tやlabel_tに変換するユーザ関数で、用途に合わせて自分で書かなけ ればならないものです。入力データが2次元であっても、左上から右下に 一列のベクトルとしてセットして、縦横の情報はレイヤー定義で与えます。 http://mevius.5ch.net/test/read.cgi/gamedev/1508056498/6
7: 535 [sage] 2017/10/16(月) 23:18:52.91 ID:nZcg7vL7 おお、ありがとうございます。 読んでみます。 http://mevius.5ch.net/test/read.cgi/gamedev/1508056498/7
8: 535 [sage] 2017/10/19(木) 00:44:02.75 ID:NEwsyYTL 気が散ってほかのことをしてしまうorz. 先延ばし先延ばしにしてしまうorz. http://mevius.5ch.net/test/read.cgi/gamedev/1508056498/8
9: 535 [sage] 2017/10/19(木) 00:44:48.21 ID:NEwsyYTL IDがNEWSや! http://mevius.5ch.net/test/read.cgi/gamedev/1508056498/9
10: 名前は開発中のものです。 [sage] 2017/10/19(木) 15:52:29.71 ID:ETYZ9m/m アルファ碁ZEROだそうな。 自己対局の強化学習のみだそうな。 レート5000越えだそうな。 囲碁AIやらなくてよかった・・・ http://mevius.5ch.net/test/read.cgi/gamedev/1508056498/10
11: 535 [sage] 2017/10/19(木) 17:50:51.04 ID:9y30JekY 旧アルファ碁に100戦100勝て 宇宙やばいってレベルじゃねーぞ? http://mevius.5ch.net/test/read.cgi/gamedev/1508056498/11
12: 名前は開発中のものです。 [sage] 2017/10/20(金) 15:58:45.15 ID:AyXCD9Rq 掲示板情報を総合するとMCTSなんだけどRolloutを使っていないという事らしい。 現在出張中なので、論文ダウンロードを躊躇しているけど、読みたいなぁ。 自分のオセロでは、スピードを稼ぐためにRolloutにヒューリスティックスな次の1手 を使用しているけど、自己対戦見ていると序盤良い感じで来ていると、Rolloutが間違 えて、負け手順に入る事が多い。それで、Rolloutせずに(したふり)Valueの遡りだけ でQ値を計算したらどうかと思っていたんだけど、そういう事な
のかなぁ。Rolloutを 省略しちゃうと、ものすごいスピードアップするので、探索が深くなるんだよなぁ。 先にやっちゃえばよかった(汗 http://mevius.5ch.net/test/read.cgi/gamedev/1508056498/12
13: 535 [sage] 2017/10/20(金) 22:03:42.47 ID:NnxpZZEA すいません、310じゃなくてもいいのでなんかコテつけてくれませんか? どうせ2人しかいないからわかるっちゃわかるけどw http://mevius.5ch.net/test/read.cgi/gamedev/1508056498/13
14: 310 [sage] 2017/10/20(金) 22:21:51.68 ID:AyXCD9Rq あ、つけ忘れ失礼。 Rollout無し版を試してますが、何故か最近静まっていた終盤読み切りのエラーが(汗 撲滅していたはずなんですが・・・ http://mevius.5ch.net/test/read.cgi/gamedev/1508056498/14
15: 名前は開発中のものです。 [sage] 2017/10/24(火) 00:38:25.07 ID:lvcSYEt0 Rollout無しのMCTSは圧倒的な探索深さを実現できるかわりに、今までRolloutで 修正かけていた評価値の誤りがダイレクトに出て、読み間違いは相変わらずです。 強化学習が進めば治るはずですが、SGDでは遅々として学習が進まないので、 optimizerをSMORMS3に戻して、一旦記譜学習を増やしてみました。やはり学習速度 が圧倒的に違います。そして、このやり方でも大丈夫っぽいです。 どうも遠回りしていたようです(汗 http://mevius.5ch.net/test/read.cgi/gamedev/15
08056498/15
16: 535 [sage] 2017/10/25(水) 20:54:40.99 ID:atHU9A83 なんだろう、このtiny-dnnの得体のしれぬハードルの高さは… パッと見、すごくよさげに見えるのに全然前に進めない。 なんだろう…なんだろう… http://mevius.5ch.net/test/read.cgi/gamedev/1508056498/16
17: 535 [sage] 2017/10/26(木) 00:13:05.87 ID:vVm7O/8N とりあえず、mnistのやつは正解をlabel_tで渡すみたいだけど 局面の勝率を正解にしたい場合はどうすればいいんだろう? ラベルと勝率じゃデータ構造違うよね多分? それとも同じなんだろうか… http://mevius.5ch.net/test/read.cgi/gamedev/1508056498/17
18: 535 [sage] 2017/10/26(木) 00:16:30.06 ID:vVm7O/8N 内積とると考えれば勝率を一次元のベクタと見なせばつじつまが合うのか? http://mevius.5ch.net/test/read.cgi/gamedev/1508056498/18
19: 名前は開発中のものです。 [sage] 2017/10/26(木) 09:53:53.13 ID:43FvyXwK >>17 mnistは、分類器(他クラス分類)なので、活性化関数はsoftmaxになり、教師データ はlabel_tで与えます。別にvec_tでも良いですが、例えば3という答えに対して、 label_tは{3}なのに対し、vec_tは{0,0,0,1,0,0,0,0,0,0}などとなって冗長なので、label_tが 用意されているわけです。他にも、誤差の計算方法が違うなんてのもあります。 一方、ゲームの勝敗予想は2値分類問題なので、活性化関数はsigmoidで、教師 データはvec_tとして、勝利を{1}、敗北を{0}
として与えて学習させます。 オセロには引き分けがあるので、引き分けは{0.5}としてみましたが、勝率50%と引き 分けでは意味がまったく違うのが悩みの種です。2人ゼロ和完全情報ゲームでは 勝率50%というのは理論上存在しないのですが、強化学習の途中などでは生じます からね。 なお、tiny_dnnでは2値分類や回帰の学習には入力データも教師データもともにvec_t で与えてfitを用い学習します。mnistのような他クラス分類でlabel_tで教師データを与え、 学習をする時はtrainを使用します。 http://mevius.5ch.net/test/read.cgi/gamedev/150
8056498/19
20: 名前は開発中のものです。 [sage] 2017/10/26(木) 09:55:34.54 ID:43FvyXwK × 他クラス分類 ○ 多クラス分類 ですね。IMEのアホたれ(汗 http://mevius.5ch.net/test/read.cgi/gamedev/1508056498/20
21: 535 [sage] 2017/10/26(木) 21:09:13.33 ID:vVm7O/8N おおーありがとうございます。 trainの代わりfitってのがあるんですね。 ドキュメント読もうとしても英語ということを差し引いても 気が散っちゃって目が滑っちゃってどうにも駄目です。 試してみます。 http://mevius.5ch.net/test/read.cgi/gamedev/1508056498/21
22: 名前は開発中のものです。 [sage] 2017/10/26(木) 22:02:22.81 ID:/MbW7Vlw CNNの例題は大抵が多クラス分類問題ですからね。 説明がfit中心になりがちです。 つか、僕もかなり目が滑りました(汗 http://mevius.5ch.net/test/read.cgi/gamedev/1508056498/22
23: 535 [sage] 2017/10/26(木) 23:07:10.48 ID:vVm7O/8N うお、コンパイル通ったけど不正終了するorz ネットワークの形が不整合起こしてるのかなぁ http://mevius.5ch.net/test/read.cgi/gamedev/1508056498/23
24: 535 [sage] 2017/10/26(木) 23:47:16.17 ID:vVm7O/8N 動いた! 入力の形がおかしかったみたい。 http://mevius.5ch.net/test/read.cgi/gamedev/1508056498/24
25: 535 [sage] 2017/10/27(金) 00:51:01.21 ID:DjbLG1y4 cross_entropyだと動くのにmseだと落ちる 完全に意味不明 http://mevius.5ch.net/test/read.cgi/gamedev/1508056498/25
26: 535 [sage] 2017/10/27(金) 01:02:07.81 ID:DjbLG1y4 cross_entropyでも動かなくなったw なんなのwww もう寝る http://mevius.5ch.net/test/read.cgi/gamedev/1508056498/26
27: 名前は開発中のものです。 [sage] 2017/10/27(金) 01:02:52.52 ID:3GgMcLzr その辺まで来ると記憶があやふやに(汗 でも落ちた記憶はないかなあ。 http://tiny-dnn.readthedocs.io/en/latest/how_tos/How-Tos.html#handle-errors この辺の参考にしてcatchしてエラーの内容表示してみました? http://mevius.5ch.net/test/read.cgi/gamedev/1508056498/27
28: 名前は開発中のものです。 [sage] 2017/10/27(金) 01:34:38.06 ID:3GgMcLzr rollout無しにして探索速度がかなり上がったのですが、10手目近辺には ツリーの深さが50手まで達してしまいまして、今度はスワップとの闘いに なりつつあります。探索幅をケチればスワップは回避できるのですが、 そうすると読み漏れが・・・。 8ギガ程度じゃこの速度を活かせません(汗 http://mevius.5ch.net/test/read.cgi/gamedev/1508056498/28
29: 310 [sage] 2017/10/27(金) 09:09:34.47 ID:InThdIzI あれれ。また名前が消えていた(汗 お分かりの通り、今のところ名無しは310です。 http://mevius.5ch.net/test/read.cgi/gamedev/1508056498/29
30: 535 [sage] 2017/10/27(金) 21:44:23.84 ID:DjbLG1y4 なんかキャッチできたみたいです。 bad allocation だそうです。 いまはmain全体をtryでくくっているのでどこで例外が出ているのかよくわからないですね。 まずはそこの絞り込みですかね。 http://mevius.5ch.net/test/read.cgi/gamedev/1508056498/30
メモ帳
(0/65535文字)
上
下
前
次
1-
新
書
関
写
板
覧
索
設
栞
歴
あと 972 レスあります
スレ情報
赤レス抽出
画像レス抽出
歴の未読スレ
Google検索
Wikipedia
ぬこの手
ぬこTOP
0.020s