【オセロ,将棋】ボードゲーム Part3【囲碁,War】 (636レス)
【オセロ,将棋】ボードゲーム Part3【囲碁,War】 http://mevius.5ch.net/test/read.cgi/gamedev/1574503798/
上
下
前
次
1-
新
通常表示
512バイト分割
レス栞
312: 310 [sage] 2020/05/31(日) 10:02:44.30 ID:/CnVYfEH またエラーが… なんとなく記憶をたどっていくと、初段で並列処理してMap-Reduceすると、βカットの関係で 評価値は合っていても、ordering次第で間違った手を返す事を思い出しました。 で、たまたま回避策となっていた処理を>>201で外してしまったのではないかと。 並列探索だと本質的に回避できない気がするので、初段を順次処理に変更。残り空きマス 26での平均処理時間。一時は20〜25秒くらいまで来ていたのが、30秒程度に悪化orz http://mevius.5ch.net/test/read.cgi/gamedev/1574503798/312
313: 535 [] 2020/06/04(木) 21:00:10.17 ID:asDXFlye 藤井センセw http://mevius.5ch.net/test/read.cgi/gamedev/1574503798/313
314: 310 [sage] 2020/06/05(金) 22:28:59.18 ID:TnykYlJh 藤井7段凄かったね。今年中に8段行っちゃうんじゃないかと思った。 エラーの原因を冷静に見直したところ、どこをどう変えたか覚えていないレベルの ちょっとした修正を加えたところからドツボって、修正するたびに更にバグを仕込んで いたような。結局、元々のプログラムに戻して、速度も復旧しました。むむむ。 こういうのがあるからから、終盤探索に手を入れたくないorz Bookの遡り修正ですが…行き詰っています。 Kyoto Cabinetはやはり単一キーしか扱えず。 メモリー上に逆引きDBを作ると、たぶんBookよりサイズが大きくなるためメモリーにおけない。 しばし悩み中。 息抜きで、棋譜作成のロジックをちょこっと修正。 同じような評価値が並んでいたり、最善手より評価値が良くなる分岐について、今までは 見つけて気になったところだけ手で追加していましたが、適度なペースで見つけて自動的 に追加する様にしました。 http://mevius.5ch.net/test/read.cgi/gamedev/1574503798/314
315: 535 [sage] 2020/06/15(月) 22:53:27.40 ID:SQc2KJ2b 長期サボりモードに突入 なんか本で読んだけどモンテカルロ木探索の訪問回数をdnnの教師データとして使うようなやり方もあるらしい http://mevius.5ch.net/test/read.cgi/gamedev/1574503798/315
316: 310 [sage] 2020/06/15(月) 23:12:30.86 ID:r41RfhWg DB化、未だに方法が見いだせずストップしてます。 パブリックドロー臭いのにそうじゃない筋を手動で修正して、20件ほどもとに戻った。 その間に、棋譜が100万件突破しました。 が、Book眺めていると、まだまだ間違い多い。 Zebraも結構間違えているけどね。 http://mevius.5ch.net/test/read.cgi/gamedev/1574503798/316
317: 535 [sage] 2020/06/17(水) 21:35:01.75 ID:nCYZMpcd 2020/05/11 グロービス、囲碁AI「GLOBIS-AQZ」のプログラムをオープンソース化 プロジェクトの集大成としてソースコードを公開 https://www.globis.co.jp/news/release/20200511_globis.html 知らなかった。 ちょっと見てみようかなぁ http://mevius.5ch.net/test/read.cgi/gamedev/1574503798/317
318: 535 [sage] 2020/06/17(水) 23:13:34.58 ID:nCYZMpcd なお、公開しているソースコードは対局・解析のみの実装で、学習に関する機能は含まれていません。 駄目じゃんorz http://mevius.5ch.net/test/read.cgi/gamedev/1574503798/318
319: 535 [sage] 2020/06/18(木) 19:28:02.18 ID:i+asT3Px ライフゲーム囲碁でモンテカルロ木探索の訪問回数をdnnの教師データにするのやり始めました。 今教師データを収集してるところです。 http://mevius.5ch.net/test/read.cgi/gamedev/1574503798/319
320: 535 [sage] 2020/06/19(金) 19:58:32.47 ID:Y5lRzoqU 教師データを学習させてみましたがあんまり強くなりませんでした。orz http://mevius.5ch.net/test/read.cgi/gamedev/1574503798/320
321: 535 [sage] 2020/06/19(金) 20:44:26.89 ID:Y5lRzoqU そもそもモンテカルロ木探索を教師にしてる時点で、モンテカルロ木探索の強さを大きくは超えられないわけで。 根本的に駄目な気はしてきたorz http://mevius.5ch.net/test/read.cgi/gamedev/1574503798/321
322: 535 [sage] 2020/06/19(金) 23:03:06.10 ID:Y5lRzoqU 結局、現状、良い教師データがないと厳しい。 アルファゼロ方式の自己対局で強くなるのは1000年かかりそうだし。 むうぅ http://mevius.5ch.net/test/read.cgi/gamedev/1574503798/322
323: 535 [sage] 2020/06/22(月) 19:37:12.00 ID:q97LdCHr katago最後のリリース https://github.com/lightvector/KataGo/releases http://mevius.5ch.net/test/read.cgi/gamedev/1574503798/323
324: 535 [sage] 2020/06/28(日) 20:46:44.93 ID:7SoJ+c30 藤井センセw 棋聖戦2勝目か http://mevius.5ch.net/test/read.cgi/gamedev/1574503798/324
325: 535 [sage] 2020/06/29(月) 19:50:03.30 ID:gKYec+q1 ライフゲーム囲碁で打った石が最終的に取られるかどうかを学習させてみようかと考え中 http://mevius.5ch.net/test/read.cgi/gamedev/1574503798/325
326: 310 [sage] 2020/07/03(金) 01:33:21.30 ID:ULg6SDrD 相変わらず棋譜作成しながら評価関数学習を続けています。ようやく100万件突破。 推定パブリックドローは大体700件くらいで増えたり減ったりしています。 対称形や合流も重複させていますので、重複除くと400件くらいかなぁ。 終盤は比較的多数の分岐を試しているのですが、序中盤の分岐が不足していて、 棋譜が偏っているような気がしてきたので、棋譜作成のロジックを大幅に変更して 序中盤の分岐が多くなるように。また、評価値とBook値が大きく違う分岐を再検証 するようにしてみました。これで、抜けている筋がだいぶ拾えるようになると期待。 棋譜作成中に暇な時間が多いので、試しにZebraと対戦。Zebraはランダムに パブリックドロー筋から外れる様にできているようですが、外れたら勝てるはずが、 なかなか勝てない。Zebra26手読み、こちらは時間の都合で20手読みくらいなので 仕方が無いのですが、それにしてもBook外れた時の評価関数の精度が悪いという事に。 あと、やはり中盤探索の速度に大きな差があり、とても26手読みなどできない。 むむむ。 http://mevius.5ch.net/test/read.cgi/gamedev/1574503798/326
327: 310 [sage] 2020/07/03(金) 01:35:54.46 ID:ULg6SDrD つか、藤井先生強すぎ。 1回勝負なら時々一発入るけど、番勝負で勝ち越せる人いないんじゃないかな。 竜王戦勝ち進んで、豊島竜王名人との番勝負が見てみたい。 http://mevius.5ch.net/test/read.cgi/gamedev/1574503798/327
328: 535 [sage] 2020/07/04(土) 11:25:12.23 ID:aqVM5XYH そこに打ったらn手以内に反撃で取られてしまうか?を判定するルーチンを書いてAIに組み込んだら、かなり動きがよくなった。 http://mevius.5ch.net/test/read.cgi/gamedev/1574503798/328
329: 535 [sage] 2020/07/05(日) 17:58:06.06 ID:pswe4q4i 結局、強化学習できない限り、DNNあんま意味ないんじゃ?という状態。 http://mevius.5ch.net/test/read.cgi/gamedev/1574503798/329
330: 535 [sage] 2020/07/09(木) 22:57:20.80 ID:j8dvyCDa 藤井センセ今日は駄目だったか。次回に期待。 http://mevius.5ch.net/test/read.cgi/gamedev/1574503798/330
331: 310 [sage] 2020/07/11(土) 00:47:07.96 ID:UjRsM2rb 残念だったね<F7先生。相当疲れているんじゃないかな。まだ連戦続くので心配。 こちらは棋譜じゃんじゃか追加中。もう逆順探索で正確さを高めるなんて言ってられない。 いちいち遡りチェックするより、分岐を増やしてしまった方が早い気がしてきた。 で、Zebraと対戦させると、まだまだ穴だらけ。Zebraがわざとパブリックドローから外した ところからが本番の対局となるのですが、そこから10〜20手の間に2回くらい間違えて 逆転される感じ。逆にZebraがほとんど間違えていない事に驚いています。評価値は怪しい ところもあるけど、選択する手のミスが本当に少ない。Zebra24手読みに変えましたが、 こちらは17手。読む深さの差もあるのか。 デバッグ用のBookチェックプログラムを改良して、簡易対戦と棋譜訂正が外から簡単 にできるようにしました。今まではプログラム動かしていると、気が付いた訂正箇所も いちいちプログラム止めないと追加できなかったのですが、動かしっぱなしのままで 訂正済棋譜にして適宜放り込めるようになりました。ただ、Bookが凄い勢いで増大して いるので、メモリーがかなり危機的状況になってきました。BookチェッカーもBook全体を 読み込むので、ダブルで効いてくる。今16Gなのですが32Gは欲しい。 Zebraに負けた棋譜の手を遡って最善手順っぽいの探して訂正していくと、まだまだ パブリックドローっぽい手順が結構見つかる。過去に間違えてパブリックドローではない と判断している奴も結構ありそうなので、見つけられたら最終800件くらいは行くと思う。 中盤探索の速度差は、ただのProbCutとMulti-ProbCutの差かなぁ。あれ、再計算が重くて 以前は実装していたんだけど、PC壊れてソース全滅して以来手を出していないのよね。 http://mevius.5ch.net/test/read.cgi/gamedev/1574503798/331
332: 535 [] 2020/07/16(木) 19:51:32.84 ID:5lwAwdbR 藤井センセええええええええええ!!! http://mevius.5ch.net/test/read.cgi/gamedev/1574503798/332
333: 310 [sage] 2020/07/17(金) 13:10:16.58 ID:wiyFtChq 王位戦第二局も含めて、ツエーーーーーーーーーー!って、今更ながらに思った。 人間相手ならabemaAI的40:60で不利な局面程度はひっくり返せるという事なんだろうなぁ。 あと、木村王位の体育座りが悲しかった。 棋譜作成は、自動作成で一気に大量に貪欲法かけたところ、既存の推定パブリックドロー筋 の4割くらいが、事前の分岐でパブリックドローから外れる事態に(汗 想定からズレた箇所は、見つけ次第ログに書き出して、そこから貪欲法でチェックするの ですが、それでもパブリックドローから外れる筋については、Zebra使って徹底チェック。 自分のAIとZebraが同意見でも、読みが深まるにつれて揺れ動くZebraの評価値を見ていた ら、なんとなくZebraが間違えていそうな着手がわかるようになってきて、その手をさらに 深堀してチェックする事で、ほぼ元の数まで戻す事ができました。たぶん、「パブリック ドローから外れるのが正解」という筋が2系統ありまして、逆に周辺を掘って行ったら別の パブリックドロー筋が見つかったりして、現在のところ残り30手推定パブリックドローが 780通り程度となりました。 増えたり減ったりはあるけど、今週だけで80件近く増えているので最終は1000件程度に なってもおかしくない気がします。 もろに、人間が判断して手作業で修正みたいなのが、悲しいところ。 Zebraが無ければこんな事できないわけで。 http://mevius.5ch.net/test/read.cgi/gamedev/1574503798/333
334: 535 [sage] 2020/07/19(日) 18:17:42.01 ID:ZoPMvH5f とりあえず、>>328のAIで棋譜取り始めることにしました。 棋譜取った後の方針はまだあんまり固まってませんが。 http://mevius.5ch.net/test/read.cgi/gamedev/1574503798/334
335: 535 [sage] 2020/07/20(月) 21:59:52.85 ID:Jx63yD56 ちょっと寄り道して4x4タイルゲームの最善手順計算してみた。 双方最善で20手で後手勝利みたい。 結構手順長いですね。 http://mevius.5ch.net/test/read.cgi/gamedev/1574503798/335
336: 535 [sage] 2020/07/21(火) 20:43:23.14 ID:bqi5P5mB あれ、ちがう? 22手かな? http://mevius.5ch.net/test/read.cgi/gamedev/1574503798/336
337: 535 [sage] 2020/07/23(木) 21:12:02.22 ID:ly3edh17 ふとやねうらおさんのサイトちょっとみてみたら、やっぱレベルたけーんだなって感じ。 http://mevius.5ch.net/test/read.cgi/gamedev/1574503798/337
338: 535 [sage] 2020/07/29(水) 22:17:32.28 ID:X7Evhq9+ さぼりまくってます。 http://mevius.5ch.net/test/read.cgi/gamedev/1574503798/338
339: 310 [sage] 2020/07/31(金) 00:20:53.97 ID:EPRjv06N 一括貪欲法を何度か繰り返す事で少し落ち着いてきたみたいで、パブリックドロー候補は 850件くらいになりました。 別途、Bookの再構築を速度アップしました。今までは文字通り再構築でしたが、直したい のはDAGから生じる矛盾の修正だったので、トップから再帰で潜って戻りながら評価値など を更新する形にして、再構築分の手間を削減しようという目論見です。が、シングルスレッド でしか動作しないため非常に遅い。最終的に、基本の対称形を一括処理するようにして、 2手目の分岐単位でスレッドを分割して、何とか20分から5分に短縮できました。 まだ、スレッド3つしか使えていないので、もうちょっと工夫して8スレッド全部使えるように しようかと思っています。目論みでは2分〜3分くらいまで行けかな。 http://mevius.5ch.net/test/read.cgi/gamedev/1574503798/339
340: 310 [sage] 2020/07/31(金) 00:22:31.35 ID:EPRjv06N >>335 タイルゲームの最善手計算凄いですね。 5×5とか6×6にしたらどうなるんでしょうね。 http://mevius.5ch.net/test/read.cgi/gamedev/1574503798/340
341: 310 [sage] 2020/08/10(月) 01:12:51.32 ID:ABN1ddg2 bookの再構築は1分50秒台まで短縮しました。 30手読み切りのパブリックドロー候補は900件超え。 割と淡々と増えているので、ホンマかいなと不安になってきています。 過去にパブリックドローとみなした筋が、パブリックドローを外れた時に、原因となった 着手を追いかけて、間違い箇所探していて、大抵直す事ができるのですが、この新しく 棋譜にした筋の評価値が結構へんてこになっています。Zebraも時々そういう局面が ありますが、結構遭遇します。おそらく過学習の絞り尻が、棋譜に出現していない局面 に押し込められているのだと思います。という訳で貪欲法のロジックを変更して、評価値 が怪しい局面から分岐をさせるように変更。とにかく棋譜を作りたいし、過去に間違えた 筋の訂正にもなるので、これをメインにしてみます。遡りチェックは、諦めて、棋譜の数の 暴力で正解筋を引く方向に変更。 そろそろ合流筋が増えて来たのと、FFOテストの局面が3つ棋譜から生成されたので、 手筋のカバー度は結構上がってきていると思うんだけどなぁ。 ちなみに現在118万棋譜。どこかで区切りつけたい気もしてきた。 http://mevius.5ch.net/test/read.cgi/gamedev/1574503798/341
メモ帳
(0/65535文字)
上
下
前
次
1-
新
書
関
写
板
覧
索
設
栞
歴
あと 295 レスあります
スレ情報
赤レス抽出
画像レス抽出
歴の未読スレ
Google検索
Wikipedia
ぬこの手
ぬこTOP
0.016s