[過去ログ]
【オセロ,将棋】ボードゲーム Part2【囲碁,War】 (1002レス)
【オセロ,将棋】ボードゲーム Part2【囲碁,War】 http://mevius.5ch.net/test/read.cgi/gamedev/1508056498/
上
下
前
次
1-
新
通常表示
512バイト分割
レス栞
このスレッドは過去ログ倉庫に格納されています。
次スレ検索
歴削→次スレ
栞削→次スレ
過去ログメニュー
279: 535 [sage] 2018/03/06(火) 22:40:05.64 ID:4NZM8BU2 こりゃネイティブLinux環境構築も考えるか… http://mevius.5ch.net/test/read.cgi/gamedev/1508056498/279
280: 535 [sage] 2018/03/07(水) 20:16:56.97 ID:Xay4EsKj ディスクアクセスが100近くいって処理がほとんど進まなくなっちまったorz いったん止めるべきかな〜 http://mevius.5ch.net/test/read.cgi/gamedev/1508056498/280
281: 310 [sage] 2018/03/08(木) 00:53:26.17 ID:KJS05rsc 新評価関数版ようやく一通りできた。 強化学習にすごーく時間がかかりそう(汗 というわけでNew PC見繕ってます。 ノートPCでi7-8700Kの6コア12スレッドにメモリー32メガで GTX1080搭載のノートPCがある。 むむむ。 http://mevius.5ch.net/test/read.cgi/gamedev/1508056498/281
282: 535 [sage] 2018/03/08(木) 18:17:36.63 ID:GeAn+CtF お高いんでしょう? http://mevius.5ch.net/test/read.cgi/gamedev/1508056498/282
283: 535 [sage] 2018/03/08(木) 19:23:50.24 ID:MQ3zVdYu 帰ってきてパソコン見てみたら学習が強制終了してました。 土曜からずっと動かしっぱなしでしたが、ここにきて強制終了は痛いですね。 解決しようにも再現させるだけで数日かかってしまうし目星を付けることすら難しそう。 http://mevius.5ch.net/test/read.cgi/gamedev/1508056498/283
284: 535 [sage] 2018/03/08(木) 20:05:12.94 ID:MQ3zVdYu 途中で出力されたポリシーモデルで対戦してみましたが、 予想してたよりずっとまともな手を返してきますね。 ほぼランダムに着手すると思ってました。 これはちゃんと学習できる環境整えればかなり期待できるかも! http://mevius.5ch.net/test/read.cgi/gamedev/1508056498/284
285: 535 [sage] 2018/03/08(木) 20:11:16.29 ID:MQ3zVdYu 俺も良い目のノート一台買ってLinux入れようかなぁ デスクトップ2台は手狭だからなぁ http://mevius.5ch.net/test/read.cgi/gamedev/1508056498/285
286: 535 [sage] 2018/03/08(木) 21:30:30.05 ID:MQ3zVdYu とりあえず、Linuxならパイソン動くことはわかったから 他のもっと高速化に力入れたalpha zeroプロジェクトも試してみようかな http://mevius.5ch.net/test/read.cgi/gamedev/1508056498/286
287: 310 [sage] 2018/03/08(木) 23:33:49.98 ID:KJS05rsc どもです。 お高いですが、デスクトップのフルスペックの1/3以下で済むようです。 回しっぱなしの奴がレアケースで異常終了すると萎えますね。 自分の奴は、たぶん怪しいところはほぼ蓋をしているので、今は安心しています。 とはいえ、評価値の保存に数秒かかるようになってしまったので、保存中にうっかり 終了してウェイトファイルを破壊しないように、いくつか策を講じました。最近はOSの アップデートで勝手に再起動されちゃうので。 http://mevius.5ch.net/test/read.cgi/gamedev/1508056498/287
288: 535 [sage] 2018/03/09(金) 20:26:00.14 ID:wTwCUiOb デスクトップの1/3って性能がですか? http://mevius.5ch.net/test/read.cgi/gamedev/1508056498/288
289: 310 [sage] 2018/03/10(土) 19:53:38.63 ID:jEGGoWyJ あ、価格と性能です(^^; 強化学習に凡ミス発見。 強化学習が良いのは、学習し続ければ何とか復旧できると思えるところorz http://mevius.5ch.net/test/read.cgi/gamedev/1508056498/289
290: 535 [sage] 2018/03/10(土) 20:42:21.57 ID:MfccYD4W 価格コムで調べたら>>281って50万以上ですよね? http://mevius.5ch.net/test/read.cgi/gamedev/1508056498/290
291: 310 [sage] 2018/03/10(土) 23:47:40.15 ID:jEGGoWyJ こいつです。 https://www.pc-koubou.jp/products/detail.php?product_id=617093 i9-7080XEのデスクトップだとメモリー頑張ると100万ですからね… http://mevius.5ch.net/test/read.cgi/gamedev/1508056498/291
292: 535 [sage] 2018/03/11(日) 00:26:26.59 ID:Rh0MFs+Y >>291 ほほう? ハイスペックノートの割には確かに安いですね。 http://mevius.5ch.net/test/read.cgi/gamedev/1508056498/292
293: 535 [sage] 2018/03/12(月) 23:17:36.89 ID:t7pU5NWq うわパイソン部分でルール間違ってたorz やっぱ軽くでもテストはやっておかないとあかんなorz http://mevius.5ch.net/test/read.cgi/gamedev/1508056498/293
294: 310 [sage] 2018/03/14(水) 21:17:53.41 ID:Hsr0gVbu うぬぬ。強化学習でどこかおかしい。 強化学習単純化しすぎちゃったかなぁ。 暫定的にひたすら記譜作成&記譜学習に戻しました。 遡り30手が鬼門。記譜学習で、ここをクリアする事を当面の目標にします。 とはいえ、残り29手完全読み切りの記譜がそれなりにあるのは、以前では 考えられない状況ではありますが。 http://mevius.5ch.net/test/read.cgi/gamedev/1508056498/294
295: 310 [sage] 2018/03/15(木) 22:46:56.01 ID:CxmBs8oA 強化学習がおかしいというより、記譜のパターンが圧倒的に足りていなかった のかもと思い始めました。それによって、着手して分岐しても±0となっている みたいな。 とりあえず、記譜の増殖手段を模索中。 今は、ヌルウィンドウサーチを使用して、遡り探索を行っている関係で、間違った 着手(石損となる手)を捨ててますが、ある程度までその手も読み切って、記譜に 加えても良いのかなぁと思っています。 とりあえず、βカット(もっと良い手があった)時の評価関数は明らかに読み間違い をしているので、そこ限定で記譜に加えていますが、ある程度以上の手数は全て 付け足しても良いのかなぁと。 http://mevius.5ch.net/test/read.cgi/gamedev/1508056498/295
296: 310 [sage] 2018/03/17(土) 02:14:23.31 ID:Foa7nGV6 なんとなく想像しただけですが、何が悪かったのかわかり始めました。 今の学習は「良い手」しか学習していないという事です。 序盤はある程度ランダムな着手を入れて、結果がばらつくようにしていますが、 途中から読みを入れて、良い手だけで着手し、その結果を遡りで訂正しています。 遡りが有効なのは30手くらいまでで、序盤のランダムは20手程度までに抑えて あります。とすると、遡れる範囲では、悪手を打ったらどういう事になるのかという 学習が抜けている。間違えた着手もちょっとだけ悪いだけでです。結果、最善手の 評価値はそこそこ正確なのですが、極端な悪手も、評価値としてはちょっとだけ 悪い数字でも問題が起きないという事になります。 これはこれで順序付けさえ合っていればそれで良いのですが、ちょっと学習が 進んで、微妙に係数が変わった時に、計算上0.1程度しか悪くない相当な悪手 をうっかり選択しやすくなってしまうという事で、これがオーダリングで悪さをして、 探索時間を長引かせてしまう可能性があります。 恐らく評価関数のステージ分割で、表現力がかなりアップした事から、こういう 学習漏れみたいな事が起きてくるのかなぁと。ほんと、評価関数はスカスカです。 というわけで、昨夜書いたように、ある程度深さを捨てて分岐をすべて記譜に残す ようにしてみようかなぁと思っています。しばらく記譜作成しながら、この事を踏まえ た強化学習をちょっと考えてみたいと思っています。 http://mevius.5ch.net/test/read.cgi/gamedev/1508056498/296
297: 535 [sage] 2018/03/18(日) 22:34:31.76 ID:tUeDVO3T 結果が出るまで時間がかかり過ぎるなぁ。 もうちょっと様子見るけど。。。 やっぱマルチスレッド化された別のalpha zeroプロジェクト探そうかな… http://mevius.5ch.net/test/read.cgi/gamedev/1508056498/297
298: 535 [sage] 2018/03/20(火) 21:45:14.39 ID:/Ra5toxr 駄目だぁ、強くなる気配がないorz 別のalpha zero プロジェクト本気で探すか… ここまで来てもったいない気もするけど… http://mevius.5ch.net/test/read.cgi/gamedev/1508056498/298
299: 535 [sage] 2018/03/23(金) 21:13:02.23 ID:Z4T42krD なんかバグ直して再学習したら、ランダムに打ったほうがマシ、くらいに変な手(1の1とか)打つんだが? もう嫌になっちゃう。 http://mevius.5ch.net/test/read.cgi/gamedev/1508056498/299
300: 535 [sage] 2018/03/23(金) 21:21:30.45 ID:Z4T42krD そういやLeela Zeroも学習過程では一線うってたな。。。 逆にいい傾向なのか??? http://mevius.5ch.net/test/read.cgi/gamedev/1508056498/300
301: 310 [sage] 2018/03/25(日) 02:23:39.84 ID:Yig4cMbl 分岐をすべて記譜にリストアップするようにしてから、爆発的に記譜が増えてます。 2000程度だったのが、15000超えました。 が、まだまだスカスカみたいです。 ここまでするんなら、真面目に自己対戦して遡りせずに、ランダム着手に対して 分岐をリストアップさせても一緒というか、早い気がしてきています(汗 http://mevius.5ch.net/test/read.cgi/gamedev/1508056498/301
302: 310 [sage] 2018/03/31(土) 01:38:59.31 ID:h3UgGfs1 ランダム着手も追加して記譜増殖中。ただいま32000超え。 もっとも、残り数手とかの記譜もあるけど(汗 ステージ分割しているので、記譜がなかなか生成されない25〜30手近辺で 非常に少ない教師データで何度も学習する事になり、そのあたりが極端な 過学習になってしまった。 解消方法をいくつか検討中です。 1)時間かかっても良いので、25〜30手の記譜ができるまで頑張る 2)前後の盤面を混ぜて、教師データを増やしてみる 3)ランダム強化学習してみる。 2)3)をやると、おそらく、平均化されて評価値がフラットになるが大小関係は 治ってくると思う。 というわけで、今夜は2)3)を試してみる予定。 http://mevius.5ch.net/test/read.cgi/gamedev/1508056498/302
303: 310 [sage] 2018/03/31(土) 01:43:35.07 ID:h3UgGfs1 あと、時々スコア指定(ヌルウィンドウサーチ)の記譜作成処理で エラー(スコア間違い)が出る時がある。 運が悪い事にハンドリングミスその他で、記譜を残せていないので、 現象の特定ができていない。 頻度としては数日に1回くらい。 たぶん、全滅と直前のパスがらみだと思うんだけど。 http://mevius.5ch.net/test/read.cgi/gamedev/1508056498/303
304: 535 [sage] 2018/03/31(土) 23:42:05.28 ID:4ltMn3J2 Geforce GTX 1060を増設しました。 >>214をpytorchで学習してみます。 http://mevius.5ch.net/test/read.cgi/gamedev/1508056498/304
305: 535 [sage] 2018/03/31(土) 23:46:58.88 ID:4ltMn3J2 んーうごかん。 GPUありとなしでポリシーファイルに互換性がないんですかね? もしかして。 初めからやり直すか… http://mevius.5ch.net/test/read.cgi/gamedev/1508056498/305
306: 310 [sage] 2018/04/01(日) 01:07:10.57 ID:OBeH+1OH おお。どんどん進んでますね。 こちらは、昨夜のバグの現象は特定しました。 スコアが62や−62で、mtd(f)の探索開始が64や−64の時に、 置換表に残った64や−64が悪さして、64や−64と誤答する模様。 とはいえ、どこを直すべきかはわかりません。探索開始が64や−64 の時に、62や−62にしてやる事で、姑息的に回避はできるので後回し。 あと、記譜作成に色々機能を加えていたら、どこかがおかしそうだという 不安な状態になってしまいまして。このまま記譜学習を進めて良いか自信 が無いので、今までのデータで安全な部分をテスト用に回して、新たに 記譜を作成開始。34手目までは全探索しながら普通に遡れる感じです。 33手目から先は探索時間がしんどいので、ひとしきり落ち着いてから、もう 一度、遡りチェックのプログラムをきちっと見直して、追加していこうかな と思っています。この間に、強化学習混ぜて、過学習部分を解消して いこうと思います。 http://mevius.5ch.net/test/read.cgi/gamedev/1508056498/306
307: 535 [sage] 2018/04/01(日) 12:43:33.62 ID:lACu3cfl お、ちゃんと時間測ってないからあれだけど、気持ち速くなってる気がする。 ちゃんと時間測りたいなぁ。 http://mevius.5ch.net/test/read.cgi/gamedev/1508056498/307
308: 310 [sage] 2018/04/01(日) 13:49:33.48 ID:DAl+8Sdv バグ問題は、結局姑息的手段では回避できず。 全滅がらみでほかのケースでも誤答するケースが発生しました。 元々FFO#59用にmin-Max探索に入れていた、全滅時の処理くらいしか 原因となりそうなものが思い当たらなかったので、とりあえずコメントアウト して様子見です。全滅時の探索が速度低下しますが、仕方がありません。 http://mevius.5ch.net/test/read.cgi/gamedev/1508056498/308
メモ帳
(0/65535文字)
上
下
前
次
1-
新
書
関
写
板
覧
索
設
栞
歴
あと 694 レスあります
スレ情報
赤レス抽出
画像レス抽出
歴の未読スレ
Google検索
Wikipedia
ぬこの手
ぬこTOP
0.015s