[過去ログ]
【オセロ,将棋】ボードゲーム【囲碁,War】 (1002レス)
【オセロ,将棋】ボードゲーム【囲碁,War】 http://mevius.5ch.net/test/read.cgi/gamedev/1057763418/
上
下
前
次
1-
新
通常表示
512バイト分割
レス栞
このスレッドは過去ログ倉庫に格納されています。
次スレ検索
歴削→次スレ
栞削→次スレ
過去ログメニュー
725: 310 [sage] 2017/02/08(水) 21:46:39.89 ID:GrcF81sn 昔mnistでオートエンコーダのテストした時のように、学習内容(ウェイト)をBMPにして 可視化してました。テストに時間がかかるので、色々すったもんだバグとりに時間が かかってましたが、ようやくなんとか表示できるようになりました。で、とりあえず想定より 少な目の隠れ層4096個でテスト開始。 勾配ノイズ(焼きなまし)の設定値もでかすぎたので、設定値を自動計算するようにしたり。 NN復活当初うまく動かなかった原因がこれでした。 で、まだ学習途中なのですが、ウェイトデータ見ると192個(=64×3)毎に1ビットづつ ずれるパターンに収れんしていっています。192といえば入力データのサイズで、 横に64個づつ並べたビットマップ画像に、まるで光子の回析実験のような縦じまが(汗 そんな周期性が生まれるはずがないので、どこかにバグがあるんじゃないかと。 表示するプログラムのバグかも知れないけど、1エポックに3時間かかるので、止めて デバッグに入るか、それとも続行するかで悶々中…。 どっちにしても時間がかかるので、裏でDCNNをもう一度コーディング開始。 あまりにネストが深いのでミニバッチは一旦放棄してSGDで。 GoogleのTensorFlowがテンソルな意味が良くわかった。 DCNNだと元データが2次元で、更にチャンネルがある行列では次元が足りないorz 今最大の懸案は、とりあえず隠れ層4096でオートエンコーダの事前 学習しているけど、 それが終わり全体の学習にいって上手く行かなかった時、中間層を増やして再トライ するか、それともDCNNに行ってしまうか。 http://mevius.5ch.net/test/read.cgi/gamedev/1057763418/725
726: 310 [sage] 2017/02/08(水) 21:47:47.17 ID:GrcF81sn >>724 そこは…絶対的に機械学習である!という信念が必要だと思います(汗 http://mevius.5ch.net/test/read.cgi/gamedev/1057763418/726
727: 535 [sage] 2017/02/09(木) 22:03:30.31 ID:qkkjChao >>726 そうですかw まあそんな気もしますが、でも終盤の積みルーチンだけなら手書きでイケそうな気もするんですよねぇ そこだけでもなんとかできれば… http://mevius.5ch.net/test/read.cgi/gamedev/1057763418/727
728: 535 [sage] 2017/02/10(金) 19:40:14.89 ID:M6OFVkZO 黒番だとDBのせいで対LV1よりも対LV2のほうが勝率いいみたいw めちゃくちゃ歪んだAIになってしまったw。 http://mevius.5ch.net/test/read.cgi/gamedev/1057763418/728
729: 310 [sage] 2017/02/10(金) 23:52:07.84 ID:HUcinQI4 3日かけて学習したオートエンコーダ型はやっぱりダメでした。 可能性すら見えなかった。 というわけで、開き直ってDCNN開始。 前回はオセロ専用で展開形を作ってましたが、それではmnistなどでテストできない ので、max_poolingも含めて、本格的にちゃんとしたものを作ってみました。 とはいえ、まだ畳み込み層の誤差逆伝播の解釈が正しいか、自信はありません。 また、テストで動かしたところ、なんかすごく重い印象です。 ちゃんと動くのかなぁ。 http://mevius.5ch.net/test/read.cgi/gamedev/1057763418/729
730: 名前は開発中のものです。 [sage] 2017/02/11(土) 10:06:04.43 ID:CnQo/DsP GGSはmimosaというソフトを使うと入れますよ http://mevius.5ch.net/test/read.cgi/gamedev/1057763418/730
731: 310 [sage] 2017/02/13(月) 22:45:03.11 ID:d/p+PbrG >>730 そのmimosaのサイトがリンク切れで見つからないのです。 http://mevius.5ch.net/test/read.cgi/gamedev/1057763418/731
732: 310 [sage] 2017/02/14(火) 20:21:59.60 ID:lpq90WbI 自作ライブラリにDCNNのレイヤーを書いたのですが、あまりの計算時間にデバッグ中に めげて、試しにtiny_dnnというC++専用のNNライブラリを入れてみましたところ、自作の 10倍以上の速度で・・・こちらに乗り換えです。 で、tiny_dnnでmnistやって感度をつかんだところで、オセロの盤面を変換する処理を 書いて、小手調べに簡単なネットワークで動かそうとしてみたところ・・・盤面データの 変換の段階でメモリーが溢れて盛大にスワップ開始(^^; 5000,000盤面×100マス(Padding含む)×4チャンネル×4バイト(float)でデータだけで 8Gbytes。自分のパソコンのメモリーは8Gで、空いているメモリーは5Gちょいとメモリー 不足が判明しました。 いまどきのパソコンはメモリーでかいから一括でも大丈夫とか言って、このざまです(笑)。 tiny_dnnは全データ一括で渡して指定エポック回してくれる仕組みなのですが、仕方ない ので、入力データを分割して、自分でループ回します。 α碁のハード環境がうらやましいorz http://mevius.5ch.net/test/read.cgi/gamedev/1057763418/732
733: 310 [sage] 2017/02/15(水) 23:06:48.81 ID:DozmM7Z3 色々細かく改造。やっぱライブラリがあると気が楽です(汗 簡単なネットワークの初期の学習の具合では正答率50%くらいが上限な印象だったので、 ネットワークを複雑にしてみました。で、1エポック8時間以上かなぁ。 もっとハードを・・・って真剣に思いますorz http://mevius.5ch.net/test/read.cgi/gamedev/1057763418/733
734: 名前は開発中のものです。 [sage] 2017/02/17(金) 23:21:12.85 ID:ZDoCs64T AMDが今度発売するcpuが結構いいかもしれない http://mevius.5ch.net/test/read.cgi/gamedev/1057763418/734
735: 310 [sage] 2017/02/19(日) 20:31:51.68 ID:PM1ZzNLK DCNNで学習させてるのですが、あまりに時間がかかるので、裏でもう一度 アルファ碁の論文を。日本語解説ページがいくつかできていて助かります。 で、読んでいたら、ロールアウトポリシーなる線形Softmaxでプレイアウトの 手を選択していると・・・。つまりはオセロ評価関数のような特徴を渡して、線形 回帰の代わりに出力をSoftmaxで確率分布にしたものです。 ロールアウトポリシーは棋譜との一致率が25%程度だけど、計算が圧倒的 に速く、このばらけ具合がちょうど良いとの事。 むむむ。アルファ碁はプレイアウトの手の選択にDCNN使ってないのねorz 日本語解説のおかげで、MCTS部の構造もようやくわかった。 いくらマシンが早くても無理だろと思っていた計算も、これなら何とかなりそう レベルの構造に落とし込まれていて、納得しました。 でも、実はまだインプットに何を食わせているのかが、よくわからない(汗 http://mevius.5ch.net/test/read.cgi/gamedev/1057763418/735
736: 535 [sage] 2017/02/19(日) 22:19:16.15 ID:FX6EUVR+ ついにアルファ碁論文まで… 英語かつ有料記事ということで私は手を出せずにいましたが日本語サイトもあるんですか。 ちょっとググってみるか… http://mevius.5ch.net/test/read.cgi/gamedev/1057763418/736
737: 310 [sage] 2017/02/20(月) 20:05:00.30 ID:L40mCRWI 論文自体はだいぶ前にダウンロードしてたんですが(汗 MCTSやらない段階では、やはり理解は難しかったと思います。 DCNN部分の投入データあたりは囲碁の知識が必要だったりしますので、 まだよくわからない点が多いです。 で、MCTS的な視点から眺めると、巷の解説とは違うところにフォーカスが あたったりします。強化学習使ったRL PolicyはValue netの事前学習で 使っていますが、プレイアウトの手の選択では線形Softmax、ノードの分岐 では教師付学習のものを使用しているなど、工夫が見られまして。オセロ は既に評価関数があるので、無理やりDCNNしなくても応用が効くのでは ないかと思ったりします。 とはいえ、今学習中の奴は、学習終わるまで1ヶ月くらいかかりそうではあり ますが、どこまで手の一致率が高められるか、見てみたい気もしています。 http://mevius.5ch.net/test/read.cgi/gamedev/1057763418/737
738: 310 [sage] 2017/02/20(月) 20:09:54.18 ID:L40mCRWI 追記。なんか格好良く書きすぎですね。 ちょうど今MCTSで悩んでいる箇所に見事な回答を与えている点に感動。 日本語で読めたので、そこに速攻で気づく事ができたという事で。 とはいえ、アルファ碁の線形SoftmaxによるRollout関数の入力データは、 囲碁の特性がわからない事から、意味不明な事もまだあり、いずれにして もそのままでは使え無さそうで、オセロに合わせて別途考えるしかなさそうです。 http://mevius.5ch.net/test/read.cgi/gamedev/1057763418/738
739: 535 [sage] 2017/02/23(木) 20:58:02.50 ID:ONUfwXLw 連続対戦してると突然落ちるバグがあるっぽいが意図的に再現できない。 どうデバッグすりゃいいんだ。orz. http://mevius.5ch.net/test/read.cgi/gamedev/1057763418/739
740: 名前は開発中のものです。 [sage] 2017/02/23(木) 23:03:49.03 ID:ONUfwXLw 再現した! けど一回再現させんのに1時間かかるw http://mevius.5ch.net/test/read.cgi/gamedev/1057763418/740
741: 535 [sage] 2017/02/24(金) 21:40:56.21 ID:sIjNtQpy コアダンプの吐かせ方がわからん。T△T デバッグオプション付けてulimit -c unlimitedだけじゃだめなんか。 ちな環境はcygwin。 http://mevius.5ch.net/test/read.cgi/gamedev/1057763418/741
742: 名前は開発中のものです。 [] 2017/02/24(金) 21:43:59.65 ID:P/wI/gFl age http://mevius.5ch.net/test/read.cgi/gamedev/1057763418/742
743: 535 [sage] 2017/02/26(日) 00:05:27.56 ID:TbeyqTpr やっと落ちてる場所見つかった。 ぬるぽだった http://mevius.5ch.net/test/read.cgi/gamedev/1057763418/743
744: 535 [sage] 2017/02/26(日) 23:30:45.62 ID:TbeyqTpr 特徴量とか便利すぎる言葉考えたやつ誰だよ。 いつでも特徴量が効率よく計算できるとは限らんだろうが。 マジムカつく。 http://mevius.5ch.net/test/read.cgi/gamedev/1057763418/744
745: 310 [sage] 2017/02/27(月) 01:19:56.03 ID:kLJ7ziJk 全く同感orz http://mevius.5ch.net/test/read.cgi/gamedev/1057763418/745
746: 535 [sage] 2017/02/28(火) 21:58:57.62 ID:+JAecqpe ファイルに2Gの壁とかあんの? 2G以上のデータはどうやって受け渡せばいいんだ。 http://mevius.5ch.net/test/read.cgi/gamedev/1057763418/746
747: 名前は開発中のものです。 [] 2017/03/01(水) 12:15:45.60 ID:jElZYckW 「29歳既婚、2年前に会社を辞めた。ボードゲーム作りを始めて3700万円を 売り上げたけど何か聞きたいことはある?」回答いろいろ http://labaq.com/archives/51880196.html 日本ボードゲーム界の異端児に聞く!ボードゲームデザイナーとして生きていくには? https://bodoge.hoobby.net/columns/00013 QRコード・クトゥルフ神話・24世紀などユニークすぎるデザインてんこ盛りのサイコロ「Dice Empire」レビュー http://gigazine.net/news/20150313-dice-empire/ ボードゲームの展示イベント「ゲームマーケット」の成長記録からこれからの 市場に必要なことを妄想してみた。6年間の来場者数推移(2016年4月時点調べ) https://bodoge.hoobby.net/columns/00001 ボードゲーム市場がクラウドファンディングの出現で急成長を遂げ市場規模を拡大中 http://gigazine.net/news/20150820-board-game-crowdfunding/ 実際のところ、自作ボードゲームってどれぐらい売れるもんなの? http://roy.hatenablog.com/entry/2016/12/20/220102 ゲームマーケット2016春にて初参加サークルさんに作成数アンケートをとってきました http://hidarigray.blog35.fc2.com/blog-entry-614.html カフェも急増 ボードゲームにアラサーがハマる理由 http://style.nikkei.com/article/DGXMZO10921930R21C16A2000000?channel=DF260120166491 ボードゲームのオリジナルオーダー制作 http://www.logygames.com/logy/ordermade.html http://mevius.5ch.net/test/read.cgi/gamedev/1057763418/747
748: 535 [sage] 2017/03/02(木) 19:55:15.50 ID:ejFPCGdH がっつり連続対戦中。黒番対LV2だけ流し終わった。 100局目 黒(airandom.dll)の勝利回数: 73 白(ai-lv2.dll)の勝利回数: 27 なお他のレベルも平行して回してるけどいま黒番対LV3に1勝54敗中w なんでこんなに差がでるのかなぁ。 http://mevius.5ch.net/test/read.cgi/gamedev/1057763418/748
749: 535 [sage] 2017/03/02(木) 20:08:53.54 ID:ejFPCGdH 対LV2はかなり同じパターンで勝ってるな。 勝利手順DBにずっぽり嵌ってくれてる感じだ。 LV3は嵌ってくれない。 http://mevius.5ch.net/test/read.cgi/gamedev/1057763418/749
750: 535 [sage] 2017/03/02(木) 21:41:10.44 ID:ejFPCGdH 序盤用DBはそこそこうまく動いているが 中盤〜終盤用のDBのせいで致命的に打ち手が狂ってるように見える。 LV3に勝てないのは多分これだな。 http://mevius.5ch.net/test/read.cgi/gamedev/1057763418/750
751: 535 [sage] 2017/03/02(木) 23:28:08.02 ID:ejFPCGdH ずいぶん昔に書いたコードにバグがあった。 ビビるくらい致命的な奴。 よく今まで動いてたな。 http://mevius.5ch.net/test/read.cgi/gamedev/1057763418/751
752: 310 [sage] 2017/03/03(金) 01:05:23.13 ID:0ijSS6CX 次の1手もDCNNもなんか上手くいかないので、アルファ碁の原点に戻りました。 アルファ碁のMTCSとしての特徴は、各ノードで評価関数を動かして、そのノードに 点をつけて勝率と50%混合する事で、ノードの選択に事前に差をつけてしまう事に あります。これによって、負けが多いけど1手だけ良い手があるルートを正しく評価 する可能性を高めていると解釈しています。 で、評価関数はオセロでは線形和で確立されているので、昔の奴をと思ったのですが、 どうせならMLPのライブラリ使ってしまえばEigenが使えるので信頼性高い上に、学習 率の最適化でモーメンタムどころかSMORMS3が使えるようになります。インプットが とても疎なので、EigenのSparseMatrixを使って高速化を図ります。 早速作って学習させてみたところ…僕の記憶が確かなら以前のプログラムの数十倍 くらいの速度で動いています(汗。これなら100エポックくらい楽勝。 今は評価値を計算させていますが、一旦できたら、次のステップで勝率を計算させられ ないかなぁと。ただ、評価値がある程度正確なら、勝率ではなく平均スコアでプレイアウト しても良いのかなと思っています。 http://mevius.5ch.net/test/read.cgi/gamedev/1057763418/752
753: 535 [sage] 2017/03/04(土) 22:29:00.76 ID:ZrhUKe4E DB初期化に35秒かかる。 コンパイラを64bit版に変えると11秒になる。 なぜこんなに差が… ちなみに囲連星本体が32bitプログラムだからコンパイラ変えられないT△T なんとかならんか? http://mevius.5ch.net/test/read.cgi/gamedev/1057763418/753
754: 535 [sage] 2017/03/05(日) 03:39:08.88 ID:LufQ1oMY コンパイラの問題じゃなくてライブラリを静的リンクするか動的リンクするかの違いみたいです。多分。 かなり早くなった^_^ http://mevius.5ch.net/test/read.cgi/gamedev/1057763418/754
メモ帳
(0/65535文字)
上
下
前
次
1-
新
書
関
写
板
覧
索
設
栞
歴
あと 248 レスあります
スレ情報
赤レス抽出
画像レス抽出
歴の未読スレ
Google検索
Wikipedia
ぬこの手
ぬこTOP
0.015s