【オセロ,将棋】ボードゲーム Part3【囲碁,War】 (636レス)
【オセロ,将棋】ボードゲーム Part3【囲碁,War】 http://mevius.5ch.net/test/read.cgi/gamedev/1574503798/
上
下
前
次
1-
新
通常表示
512バイト分割
レス栞
549: 310 [sage] 2021/10/21(木) 09:52:39.74 ID:1G6/45ua 無限時間を相手にした時に本来の確率通りになるのは自明ですね。 短い時間での試行だと、階段状になるので解析は難しいかも知れません。直観ではAが 勝った時には追加時間が入るようなものなのでAが有利になりそうではありますよね。 面倒なので勝手に問題を書き換えてみます。 「糞粘りするソフトAが有利にならず真の強弱を判定するためには、どのくらいの時間を かけて対戦させ計測すればよいのか。」 時間を考慮に入れずに試行回数を決めて計測すれば解決する問題な気がします(汗
また、真の強弱を調べる場合に必要な試行回数は、母集団の推定ってやつなので、どこか 探せば出てくると思います。時間で区切る場合は、その試行回数を実行した時の「経過時間 の分布」ととらえる事もできますので、ここで問題を分割して、どのくらい試行時間を掛ければ 十分な試行回数が得られるのか問題ととらえなおすことができると思います。 実際の計算は… この定理に関して、私は真に驚くべき証明を見つけたが、この余白はそれを書くには狭すぎる(笑) http://mevius.5ch.net/test/read.cgi/gamedev/1574503798/549
550: 535 [sage] 2021/10/21(木) 18:27:47.45 ID:wSfhgfMF >無限時間を相手にした時に本来の確率通りになるのは自明ですね。 ありがとうございます。 ここ結構悩んでしまいました。自明なんですね。 数学的直感力が衰えてるのかなー http://mevius.5ch.net/test/read.cgi/gamedev/1574503798/550
551: 535 [sage] 2021/10/23(土) 16:56:30.70 ID:QOsHN9x8 実をいうと囲連星のAI作成をまたやっていて、 LV3に開幕19連勝というとんでもない数字をたたき出したのですが 100戦もすると勝率5割ほどに落ちてきてしまい、 なぜこんなことが起こるのだろうと不思議に思っていたのです。 どうやら糞粘りのせいみたいですね。 http://mevius.5ch.net/test/read.cgi/gamedev/1574503798/551
552: 535 [sage] 2021/10/27(水) 18:51:11.06 ID:e37CEc8v 囲碁AIの最強の一角であるKataGoを改造して囲連星やライフゲーム囲碁、タイルゲームのAIをつくるのチャレンジしてみようか悩み中 http://mevius.5ch.net/test/read.cgi/gamedev/1574503798/552
553: 310 [sage] 2021/10/27(水) 22:24:54.19 ID:EdJdOKHZ 自明というほどの証明は僕にはありません(汗 開幕19連勝しちゃうとかなり期待しますよね。 やはり強さを確定するためにはそれなりの試行回数が必要という事なんでしょう。 開幕29連勝したお方は凄い事になってますし。 タイルゲームまたやってみようかな。 MCTSと親和性高そうだし。 min-Max系は自分の力では、これ以上高速化できない気がしています。 http://mevius.5ch.net/test/read.cgi/gamedev/1574503798/553
554: 310 [sage] 2021/10/27(水) 22:32:23.20 ID:EdJdOKHZ オセロの方は、評価関数は自己対局用にそこそこの奴ができればいいやと、Book構築 の方に力を入れています。ロジックで間違っていそうな筋を分岐させてみたり、ドローっ ぽい棋譜はかなり厳しめに分岐させてチェックしてみたり、目視で怪しいところ見つけたら 手動で分岐させてみたり。でも、なんか賽の河原状態に陥っています。どこかで安定しだ すと期待していたら逆で、どんどん宿題が積み上がっていく感じです。 気分転換に、以前一回諦めた、読み切り処理で正解分岐が複数あって、既に
確定済の 筋以外の手を選ぶロジックを見直していました。半年〜1年くらい放置していた奴です。 今見たら何を悩んでいたのかというくらい、当時の問題があっさり解決しました。まあ、 読み切り速度が20〜30%遅くなってしまうのですが、分岐を作れるので教師データに は良いかなと。 評価関数の学習は、またパンクしてしまったので、バイナリファイル上でシャッフルする 処理を書きましたが、処理時間が怖くてまだ試していません。いっそ、もう一度評価関数 をステージ分割してしまった方が良いのではないかと思い始めています。 や
ればやるほどZebraの評価関数の正確さに頭が下がる思いです。 http://mevius.5ch.net/test/read.cgi/gamedev/1574503798/554
555: 535 [sage] 2021/10/28(木) 19:14:15.82 ID:cjBYhho+ 310さん、タイルゲームもやってたんだ。へー http://mevius.5ch.net/test/read.cgi/gamedev/1574503798/555
556: 310 [sage] 2021/10/28(木) 20:34:55.57 ID:tAZRxFew ルールを理解して、盤面の内部表現と勝敗判定を考え始めたところで うっちゃってますので、まだ何もしていません(汗 http://mevius.5ch.net/test/read.cgi/gamedev/1574503798/556
557: 535 [sage] 2021/10/30(土) 17:48:57.15 ID:UiBk2jXZ AMDの株がかなり上がったのでパソコン買っちゃいました! https://imgur.com/a/5UZPyiN http://mevius.5ch.net/test/read.cgi/gamedev/1574503798/557
558: 310 [sage] 2021/10/30(土) 22:23:00.51 ID:KcRkQNBB パソコンうらやましす。 メモリー128Gで32スレッドくらい欲しいなぁ。 評価関数は結局ステージ分割にしています。が、学習途中でEigenがコケる。 なんとなくステージ単位での件数オーバーっぽいので、更にステージ分割を 細かくしてみていますが、今日1日の作業がパーで、また丸1日くらいかかる のかなと。 まだ原因特定できた訳ではないし、件数が大丈夫かも判然としないので、また こけないか心配ではあります。 http://mevius.5ch.net/test/read.cgi/gamedev/1574503798/558
559: 535 [] 2021/10/31(日) 18:56:25.43 ID:P/0PQ7su Katagoですが、Katagoで使われてるpythonスクリプトはTensorflow 1.15を想定していて Tensorflow 1.15はCUDA 10.0を想定していて、 RTX 3070 TiはCUDA 10.0をサポートしてない ということらしい。 詰んだかも orz orz orz orz orz http://mevius.5ch.net/test/read.cgi/gamedev/1574503798/559
560: 535 [sage] 2021/10/31(日) 20:00:24.60 ID:P/0PQ7su 藤井先生、竜王までいってしまうか。 7冠当選確実ですねー http://mevius.5ch.net/test/read.cgi/gamedev/1574503798/560
561: 310 [sage] 2021/10/31(日) 23:27:26.19 ID:wMiG8knd GPUにはそんな相性問題があるのですか… 色々調べてやらないとダメですね。 コケる原因と思われるところを見つけました。 色々やった挙句、矛盾した盤面がありそうだという事になって、調べたらビンゴ。 これからヨタプロ書いて、問題の棋譜を見つけて削除するつもり。 デバッグ中にさらに色々評価関数のを見つけてしまいました。 評価関数って多少バグってても、それっぽく学習しちゃうんだよねorz。 http://mevius.5ch.net/test/read.cgi/gamedev/1574503798/561
562: 310 [sage] 2021/11/01(月) 07:58:02.78 ID:dM9ZkTyW 多分解決。 棋譜の問題じゃなくてBook構築時の問題でした。 40手目までBook登録しているのですが、40手目以前に全滅した時の 終局判定が漏れていて、無いはずの矛盾した後続の盤面を作ってました。 普段は全く影響でないのですが、Bookまとめて読みだして処理をかける時 だけ出てくる奴です。 昨夜学習開始しましたが、まだ問題箇所を全部通過したわけではありません。 が、たぶん大丈夫だと思う。昼過ぎにはわかるはず。 Book再構築に1時間と、学習に丸1日以上かな。 明日の朝まで
には第一陣の学習が終わるかな? まだ学習回数不足で評価値が安定していなので、バグが快勝していても、 しばらくは時間がかかりそうです。 http://mevius.5ch.net/test/read.cgi/gamedev/1574503798/562
563: 535 [sage] 2021/11/01(月) 19:33:56.38 ID:+SuiL1m9 NVIDIA製のDocker使うとRTX 3070 ti でも Tensorflow 1.15 使えるという記事がちらほらある。 ゴールは遠いなぁ。 http://mevius.5ch.net/test/read.cgi/gamedev/1574503798/563
564: 310 [sage] 2021/11/01(月) 23:01:49.02 ID:dM9ZkTyW とりあえず問題箇所全クリアは確認できました。 エポック10回で1日半かかるのが面倒。 せめて50エポックくらいしたい。 今週は学習週刊になりそう。 http://mevius.5ch.net/test/read.cgi/gamedev/1574503798/564
565: 535 [sage] 2021/11/02(火) 20:13:09.48 ID:28WH20bm Dockerにがっぷり4つで取り組むのちょっとしんどいなぁ ペースを落としてのんびり行くか。 http://mevius.5ch.net/test/read.cgi/gamedev/1574503798/565
566: 535 [sage] 2021/11/05(金) 19:33:49.37 ID:AWXtKWsR なんかwindows insider programとかいうのに入らないといけないらしくかなり敷居が高い。 いったん退却するか? http://mevius.5ch.net/test/read.cgi/gamedev/1574503798/566
567: 535 [sage] 2021/11/05(金) 20:07:40.63 ID:AWXtKWsR 将棋は最高7冠じゃなくて8冠なんですねー 叡王忘れてた http://mevius.5ch.net/test/read.cgi/gamedev/1574503798/567
568: 310 [sage] 2021/11/05(金) 20:47:26.54 ID:TX9UwcXB 心の迷いから、途中まで学習して止めて、ちょこっと修正してを繰り返してますのでまったく 学習が進んでいません。Bookチェック用コンソールでの浅い探索がびっくりするほど遅く なってしまい、原因を探したりなんやかんややっていたのが迷いの原因です。 最終的にステージ分割を止めて、8対称を4対称に落として教師データを半分にしたりして 学習再開しました。1エポック1時間半でとりあえず30回学習させてみるという事で仕上がり は日曜日の夕方〜夜の予定。まるまる1週間パ
ーになりました。 もともと件数オーバーでメモリ溢れ始めたのは、4対称だったのを8対称に変えてからだった ような気がしてきました。また、ステージ分割も、昔1回トライして、速度低下が酷くてやめ ちゃった事があったような記憶もうっすら残っています。なんつーか、こういう類の手戻りが多いorz ただ、探索がステージ分割だけで遅くなるとも思えないです。浅い探索は単純なαβで、 オーダリングはヒューリスティックスオンリーだし、ProbCutもしていないです。分割により 評価値ゼロとなる末端が多くてβカットが減っているのかなと思っていま
す。間違っていて も値が入っていればβカットはされますから。 棋譜作成にランダム要素加えて、悪手変化後の局面もたくさん学習させないといかんのかな。 http://mevius.5ch.net/test/read.cgi/gamedev/1574503798/568
569: 535 [sage] 2021/11/06(土) 21:09:48.75 ID:fJzqcDF5 NVIDIAのドライバ色々入れたらなんかパソコンの調子悪くなったorz もーやめてくれー http://mevius.5ch.net/test/read.cgi/gamedev/1574503798/569
570: 310 [sage] 2021/11/06(土) 21:44:45.75 ID:zi779w0E なんか評価値がおかしかったのでチェックしていたら、末端ノードでの評価値の差分計算 がおかしくなっていた。もともとちゃんと動いていた箇所なので、何故変わっていたのか謎。 これも激遅の原因の一つではあると思うけど、まだ遅いんだよなぁ。 http://mevius.5ch.net/test/read.cgi/gamedev/1574503798/570
571: 535 [sage] 2021/11/09(火) 07:27:58.79 ID:V517zoPP AMD株が凄いことになってる http://mevius.5ch.net/test/read.cgi/gamedev/1574503798/571
572: 535 [sage] 2021/11/13(土) 10:00:35.49 ID:JzxMx88v 6x6タイルゲームに手を出し始めました http://mevius.5ch.net/test/read.cgi/gamedev/1574503798/572
573: 535 [sage] 2021/11/13(土) 22:32:47.82 ID:JzxMx88v 藤井先生、竜王とったか もう誰も止められんね http://mevius.5ch.net/test/read.cgi/gamedev/1574503798/573
574: 535 [sage] 2021/11/13(土) 23:49:46.04 ID:JzxMx88v 藤井先生、竜王とったか もう誰も止められんね http://mevius.5ch.net/test/read.cgi/gamedev/1574503798/574
575: 310 [sage] 2021/11/15(月) 00:36:16.61 ID:hveDHfQn 藤井先生はAIだと思うようになりました(汗 新人王とった伊藤匠4段もかなり強いね。これから期待です。 評価関数学習し始めたら、オプティマイザーでSMORMS3は学習開始直後の集束は 滅茶苦茶早いんだけど、汎化が上手く行かないので、momentumと併用していたのを 思い出して、今はmomentumで毎晩6エポックづつ学習させてます。結構よくなって きたけど、まだまだかなぁ。このまま続けたら速さは戻りそうですが… それならステージ分割してまた学習やり直しても良いのではないか
と思ってみても 良いのかなという気がし始めています(汗 途中、棋譜をほぼ全部飛ばしそうなバグ出してました。 たまたま戻せましたが、危ない危ない。 http://mevius.5ch.net/test/read.cgi/gamedev/1574503798/575
576: 310 [sage] 2021/11/22(月) 02:44:48.95 ID:EeZe+kFL 中盤探索劇遅の原因わかりました。 static constな関数をstatic constexprに変更していたのが原因のようです。 色々原因探して、最後の最後にまさかと思って、戻してもたら速度問題解消。 constexprにしたらコンパイル時定数扱いになると思っていたのですが何故? http://mevius.5ch.net/test/read.cgi/gamedev/1574503798/576
577: 535 [sage] 2021/12/04(土) 16:31:24.68 ID:6uZ5YSAD 6x6オセロて完全解析されてるんですよね? 6x6タイルゲーム完全解析出来ないかなあ http://mevius.5ch.net/test/read.cgi/gamedev/1574503798/577
578: 535 [sage] 2021/12/12(日) 11:39:50.61 ID:ZeZ8k4MF タイルゲームですが、現局面の勝率をモンテカルロでしらべて4割以上6割以下ならノードを展開し以下再帰的に繰り返す、というのを考えたのですが、あんまり枝刈りの効率が良くなくてガッカリしてます。 http://mevius.5ch.net/test/read.cgi/gamedev/1574503798/578
メモ帳
(0/65535文字)
上
下
前
次
1-
新
書
関
写
板
覧
索
設
栞
歴
あと 58 レスあります
スレ情報
赤レス抽出
画像レス抽出
歴の未読スレ
Google検索
Wikipedia
ぬこの手
ぬこTOP
0.016s