[過去ログ]
【オセロ,将棋】ボードゲーム Part2【囲碁,War】 (1002レス)
【オセロ,将棋】ボードゲーム Part2【囲碁,War】 http://mevius.5ch.net/test/read.cgi/gamedev/1508056498/
上
下
前
次
1-
新
通常表示
512バイト分割
レス栞
このスレッドは過去ログ倉庫に格納されています。
次スレ検索
歴削→次スレ
栞削→次スレ
過去ログメニュー
305: 535 [sage] 2018/03/31(土) 23:46:58.88 ID:4ltMn3J2 んーうごかん。 GPUありとなしでポリシーファイルに互換性がないんですかね? もしかして。 初めからやり直すか… http://mevius.5ch.net/test/read.cgi/gamedev/1508056498/305
306: 310 [sage] 2018/04/01(日) 01:07:10.57 ID:OBeH+1OH おお。どんどん進んでますね。 こちらは、昨夜のバグの現象は特定しました。 スコアが62や−62で、mtd(f)の探索開始が64や−64の時に、 置換表に残った64や−64が悪さして、64や−64と誤答する模様。 とはいえ、どこを直すべきかはわかりません。探索開始が64や−64 の時に、62や−62にしてやる事で、姑息的に回避はできるので後回し。 あと、記譜作成に色々機能を加えていたら、どこかがおかしそうだという 不安な状態になってしまいまして。このまま記譜学習を進めて良いか自信 が無いので、今までのデータで安全な部分をテスト用に回して、新たに 記譜を作成開始。34手目までは全探索しながら普通に遡れる感じです。 33手目から先は探索時間がしんどいので、ひとしきり落ち着いてから、もう 一度、遡りチェックのプログラムをきちっと見直して、追加していこうかな と思っています。この間に、強化学習混ぜて、過学習部分を解消して いこうと思います。 http://mevius.5ch.net/test/read.cgi/gamedev/1508056498/306
307: 535 [sage] 2018/04/01(日) 12:43:33.62 ID:lACu3cfl お、ちゃんと時間測ってないからあれだけど、気持ち速くなってる気がする。 ちゃんと時間測りたいなぁ。 http://mevius.5ch.net/test/read.cgi/gamedev/1508056498/307
308: 310 [sage] 2018/04/01(日) 13:49:33.48 ID:DAl+8Sdv バグ問題は、結局姑息的手段では回避できず。 全滅がらみでほかのケースでも誤答するケースが発生しました。 元々FFO#59用にmin-Max探索に入れていた、全滅時の処理くらいしか 原因となりそうなものが思い当たらなかったので、とりあえずコメントアウト して様子見です。全滅時の探索が速度低下しますが、仕方がありません。 http://mevius.5ch.net/test/read.cgi/gamedev/1508056498/308
309: 310 [sage] 2018/04/02(月) 20:15:06.48 ID:9LYme7cN 結局バグ問題は…迷宮入り臭いです。 記譜作成で負荷テスト並みに探索を繰り返すと、全滅絡まなくても間違うケースが 出てきました。再現性が無いのが辛いところ。 その昔悩んでいた時も、やっぱり置換表がらみの問題で迷宮入りでしたが、 今回も、ケチって置換表を極力クリアせずに使用していた事から、何らかの 矛盾が起きているようです。それを言っちゃうと、置換表付mtd(f)でf値を変え ながら探索することも、またその時に作成された置換表を流用して記譜作成 兼ねた読み切り処理を速度アップすることも、怪しいという事になるわけで。 間違えてしまった事が判明した時点で、その探索は捨てるくらいしか対策が 無いという事になります。 ネットで調べたら、将棋AI界隈でも置換表の問題点を書いている人がいまして。 少なくとも深さがあっていない置換表データは使うべきではない模様。 今の調子だと一晩動かすと結構な頻度で朝見たら止まっているとい状態なので せめて発生率を下げるべく、mtd(f)に入る前に置換表をクリアする事にしました。 なぜしなかったかというと、記譜データからスコアが確定している盤面を置換表に 入れて、それを見ながら既に読み切りしている盤面は飛ばす処理をしていたから です。置換表をクリアして盤面再構築に時間がかかるためです。別途盤面キャッシュ を持って、そちらは追記、置換表は毎回クリアという形に変更しました。 http://mevius.5ch.net/test/read.cgi/gamedev/1508056498/309
310: 535 [sage] 2018/04/02(月) 22:24:32.85 ID:3iK+AnRP Leela ZeroがKGSでかなり強くなってる。 俺がパクったプログラムも学習し続けたらあれくらい強くなるんだろうか? http://mevius.5ch.net/test/read.cgi/gamedev/1508056498/310
311: 535 [sage] 2018/04/04(水) 20:42:51.24 ID:Y0WMbzNW え、ちょっとまってよ。 GPUありなしでポリシーファイルが違うってことは 成果物を配布しようとしたらGPU持ってる人しか遊べないってこと? http://mevius.5ch.net/test/read.cgi/gamedev/1508056498/311
312: 535 [sage] 2018/04/04(水) 20:54:25.72 ID:Y0WMbzNW しかもCUDAとかも一緒にインストールしてもらわないといけない? ええぇ? http://mevius.5ch.net/test/read.cgi/gamedev/1508056498/312
313: 310 [sage] 2018/04/06(金) 22:00:28.44 ID:952uhqxW 誤答問題は、置換表クリアで解消しました。 違う局面の探索で使用した置換表データは使いまわしてはいけないという事で。 なんか、結果的に、2年くらい前にも同じ事で騒いでいたような。 色々整ってきたので、あとはひたすら記譜作成しながら学習を回すだけになって しまって、暇になってます。別PC買ってそっちで学習させながら、別の事をはじめ ようかなぁと思い始めています。 http://mevius.5ch.net/test/read.cgi/gamedev/1508056498/313
314: 535 [sage] 2018/04/07(土) 20:43:17.69 ID:SqbCC315 うーん、つよくならないorz 学習は継続しつつ別のalpha zero プロジェクトも物色するか… http://mevius.5ch.net/test/read.cgi/gamedev/1508056498/314
315: 535 [sage] 2018/04/08(日) 22:10:18.77 ID:ZB9Bj6DG ん、なんかメモリリークあんのかな… swigでC++から移植したクラスってデフォルトでガベージコレクトされないのかなぁ? もしかして。 http://mevius.5ch.net/test/read.cgi/gamedev/1508056498/315
316: 535 [sage] 2018/04/08(日) 22:43:04.99 ID:ZB9Bj6DG VMWareの設定がメモリ1GBになってた。 とりあえず8GBに増やしてみた。 http://mevius.5ch.net/test/read.cgi/gamedev/1508056498/316
317: 535 [sage] 2018/04/08(日) 22:53:48.62 ID:ZB9Bj6DG お、メモリ増やして再起動かけたら結構いい感じで進みだした? メモリ増やしたのと再起動かけたのどっちが効いたのかわからんが。 http://mevius.5ch.net/test/read.cgi/gamedev/1508056498/317
318: 535 [sage] 2018/04/09(月) 20:58:16.91 ID:500BArdX くそ〜ベストポリシー更新が全く来ないorz もう何回目だ?TT http://mevius.5ch.net/test/read.cgi/gamedev/1508056498/318
319: 535 [sage] 2018/04/11(水) 20:46:51.70 ID:uiOmKVU+ お、メモリ増やしたせいか連続運転が安定している。 しかしベストポリシー更新は相変わらずなしorz http://mevius.5ch.net/test/read.cgi/gamedev/1508056498/319
320: 535 [sage] 2018/04/11(水) 23:07:04.06 ID:uiOmKVU+ もしかして、ネットワークの初期値が糞すぎるんだろうか。 でも確かめようがないorz http://mevius.5ch.net/test/read.cgi/gamedev/1508056498/320
321: 535 [sage] 2018/04/15(日) 20:07:24.81 ID:8sCJrZFg ベストポリシー更新まじコネ〜 でも他のプロジェクトに浮気しようにもなかなか手ごろなのがないんだよなぁ http://mevius.5ch.net/test/read.cgi/gamedev/1508056498/321
322: 535 [sage] 2018/04/15(日) 20:21:37.51 ID:8sCJrZFg いっそ実績のあるLeelaZeroを本気でパクりに行ってみるべきか… でも多分、難解なんだろうな〜 http://mevius.5ch.net/test/read.cgi/gamedev/1508056498/322
323: 535 [sage] 2018/04/16(月) 20:30:05.64 ID:6KBtspgu あんまりおかしいんでソースをオリジナルとdiffとったら学習係数が1/100になってたんだがwww え〜何時いじったかな全く記憶にないwww これで学習が進んでくれれば!! http://mevius.5ch.net/test/read.cgi/gamedev/1508056498/323
324: 535 [sage] 2018/04/16(月) 23:37:28.33 ID:6KBtspgu loss も entropyも減ってきてる! これでベストポリシー更新が来れば!! http://mevius.5ch.net/test/read.cgi/gamedev/1508056498/324
325: 535 [sage] 2018/04/17(火) 22:16:19.94 ID:E16XJnGD キタ━━━━━━(゚∀゚)━━━━━━ !!!!! ベストポリシー更新きました! 次の切りのいいところで止めてプレーしてみよう http://mevius.5ch.net/test/read.cgi/gamedev/1508056498/325
326: 535 [sage] 2018/04/17(火) 22:34:03.78 ID:E16XJnGD それはそうとzen+の発売日が迫ってますね。 金がないから買えないけど情報だけは追っかけてみます。 爆速だといいな。 http://mevius.5ch.net/test/read.cgi/gamedev/1508056498/326
327: 535 [sage] 2018/04/18(水) 23:48:24.10 ID:7NtNWbU1 あとちょっとだけ待とう 終局までの手数も順調に減ってきてるから意味のある手を打ってるんだろう多分 ワクワク http://mevius.5ch.net/test/read.cgi/gamedev/1508056498/327
328: 535 [sage] 2018/04/19(木) 20:50:17.33 ID:lyvIQrMy 打ってみました。 序盤、中盤は棋理の芽生えみたいなものが感じられました。 伸ばせそうなところを伸ばすとか伸ばされそうなところを止めに来るとか でもわざと負けようとしても5連までは積極的に作りに来るのにそこからパタッと伸ばすのをやめて7連を作ってくれませんw なぜw? でもまあ、希望は感じられました。 もうすこし学習してみます。 http://mevius.5ch.net/test/read.cgi/gamedev/1508056498/328
329: 535 [sage] 2018/04/19(木) 23:51:35.82 ID:lyvIQrMy zen+なかなかよさげですね。 前世代と比べて一割前後性能アップ? http://mevius.5ch.net/test/read.cgi/gamedev/1508056498/329
330: 310 [sage] 2018/04/20(金) 09:40:06.18 ID:HgLFJ5UM うーん。AMDはSIMD命令で遅い命令があって、速度低下するかもって どこかで読んじゃったからなぁ。 こちらは地道に記譜作成しながら学習させてます。 深さ優先で記譜作成すると、分岐が少ない手筋ばかり増えていくので、 幅優先で、同じ深さである程度記譜溜まってから、次の深さとするように したのですが、空きマス27からの記譜展開で、時間がかかるようになって なかなか空き28マスに行けない。オーダリングの精度が出ていないから だと思いますが、同時に選択肢も増えてきて、余計時間がかかる感じ。 空き30マス突破したら、かかる時間の増加率は下がるはずなんだけど。 http://mevius.5ch.net/test/read.cgi/gamedev/1508056498/330
331: 535 [sage] 2018/04/20(金) 22:59:48.32 ID:1YRRGto3 もしかして終盤はあえてランダム性を残すことによって学習が進みやすくなるなどの深い理由があるのだろうか? わからんが。 http://mevius.5ch.net/test/read.cgi/gamedev/1508056498/331
332: 535 [sage] 2018/04/20(金) 23:02:21.21 ID:1YRRGto3 それとも序盤は同一局面のデータがたくさん現れるから学習できるけれど 終盤に行くとデータが散らばっちゃって学習できなくなるということだろうか http://mevius.5ch.net/test/read.cgi/gamedev/1508056498/332
333: 名前は開発中のものです。 [sage] 2018/04/20(金) 23:03:29.26 ID:1YRRGto3 あるいは一線や二線は打たないほうがいいと学習してしまっているがため、7連を作れないのだろうか? http://mevius.5ch.net/test/read.cgi/gamedev/1508056498/333
334: 310 [sage] 2018/04/21(土) 20:32:42.81 ID:AdkW58BW オセロは記譜生成させてるだけで暇なので、将棋の事を考えてました。 KKPとかよくわからないし、同じ事をやってもつまらないので、利きを点数化 しようかと考えてみまして、実際の計算方法を考えていたら、自玉周辺と 相手玉に対する利きがKKPなのではないかと思い至ってしまいました。 持ち駒の点数は駒種毎に固定で振られていて、駒同士のぶつかりによる優劣 特に駒交換はmin-Maxにて補間しているのかなと。評価関数自体は意外と単純 な事しか学習していない感じで、探索で補っている部分が大きいように感じます。 こうやって見ると、上手く単純化しているなぁと。 自分で勝手に想像した内容に感心してしまいました。 ただ、これならこれで、自玉KPと相手玉KPの合算で、2駒関係に次元を落とせ そうではないかと思ってしまいました。まあ、無理なんでしょうけど。 自分がやる上での一番のネックは、オセロの評価関数が点数だったために、 なんちゃって強化学習しかやった事がな点ですね。あと、みなさんライブラリ化 されていて、それに則れば色々な人の考えた高速化・高効率化のネタが利用 できる点で、一から車輪の再発明していては追い付けないよなぁと。 http://mevius.5ch.net/test/read.cgi/gamedev/1508056498/334
メモ帳
(0/65535文字)
上
下
前
次
1-
新
書
関
写
板
覧
索
設
栞
歴
あと 668 レスあります
スレ情報
赤レス抽出
画像レス抽出
歴の未読スレ
Google検索
Wikipedia
ぬこの手
ぬこTOP
0.016s