【オセロ,将棋】ボードゲーム Part3【囲碁,War】 (636レス)
1-

549: 310 2021/10/21(木)09:52 ID:1G6/45ua(1) AAS
無限時間を相手にした時に本来の確率通りになるのは自明ですね。
短い時間での試行だと、階段状になるので解析は難しいかも知れません。直観ではAが
勝った時には追加時間が入るようなものなのでAが有利になりそうではありますよね。

面倒なので勝手に問題を書き換えてみます。

「糞粘りするソフトAが有利にならず真の強弱を判定するためには、どのくらいの時間を
かけて対戦させ計測すればよいのか。」

時間を考慮に入れずに試行回数を決めて計測すれば解決する問題な気がします(汗

また、真の強弱を調べる場合に必要な試行回数は、母集団の推定ってやつなので、どこか
探せば出てくると思います。時間で区切る場合は、その試行回数を実行した時の「経過時間
の分布」ととらえる事もできますので、ここで問題を分割して、どのくらい試行時間を掛ければ
十分な試行回数が得られるのか問題ととらえなおすことができると思います。

実際の計算は…
この定理に関して、私は真に驚くべき証明を見つけたが、この余白はそれを書くには狭すぎる(笑)
550: 535 2021/10/21(木)18:27 ID:wSfhgfMF(1) AAS
>無限時間を相手にした時に本来の確率通りになるのは自明ですね。

ありがとうございます。
ここ結構悩んでしまいました。自明なんですね。
数学的直感力が衰えてるのかなー
551: 535 2021/10/23(土)16:56 ID:QOsHN9x8(1) AAS
実をいうと囲連星のAI作成をまたやっていて、
LV3に開幕19連勝というとんでもない数字をたたき出したのですが
100戦もすると勝率5割ほどに落ちてきてしまい、
なぜこんなことが起こるのだろうと不思議に思っていたのです。
どうやら糞粘りのせいみたいですね。
552: 535 2021/10/27(水)18:51 ID:e37CEc8v(1) AAS
囲碁AIの最強の一角であるKataGoを改造して囲連星やライフゲーム囲碁、タイルゲームのAIをつくるのチャレンジしてみようか悩み中
553: 310 2021/10/27(水)22:24 ID:EdJdOKHZ(1/2) AAS
自明というほどの証明は僕にはありません(汗
開幕19連勝しちゃうとかなり期待しますよね。
やはり強さを確定するためにはそれなりの試行回数が必要という事なんでしょう。
開幕29連勝したお方は凄い事になってますし。

タイルゲームまたやってみようかな。
MCTSと親和性高そうだし。
min-Max系は自分の力では、これ以上高速化できない気がしています。
554: 310 2021/10/27(水)22:32 ID:EdJdOKHZ(2/2) AAS
オセロの方は、評価関数は自己対局用にそこそこの奴ができればいいやと、Book構築
の方に力を入れています。ロジックで間違っていそうな筋を分岐させてみたり、ドローっ
ぽい棋譜はかなり厳しめに分岐させてチェックしてみたり、目視で怪しいところ見つけたら
手動で分岐させてみたり。でも、なんか賽の河原状態に陥っています。どこかで安定しだ
すと期待していたら逆で、どんどん宿題が積み上がっていく感じです。

気分転換に、以前一回諦めた、読み切り処理で正解分岐が複数あって、既に確定済の
筋以外の手を選ぶロジックを見直していました。半年〜1年くらい放置していた奴です。
今見たら何を悩んでいたのかというくらい、当時の問題があっさり解決しました。まあ、
読み切り速度が20〜30%遅くなってしまうのですが、分岐を作れるので教師データに
は良いかなと。

評価関数の学習は、またパンクしてしまったので、バイナリファイル上でシャッフルする
処理を書きましたが、処理時間が怖くてまだ試していません。いっそ、もう一度評価関数
をステージ分割してしまった方が良いのではないかと思い始めています。

やればやるほどZebraの評価関数の正確さに頭が下がる思いです。
555: 535 2021/10/28(木)19:14 ID:cjBYhho+(1) AAS
310さん、タイルゲームもやってたんだ。へー
556: 310 2021/10/28(木)20:34 ID:tAZRxFew(1) AAS
ルールを理解して、盤面の内部表現と勝敗判定を考え始めたところで
うっちゃってますので、まだ何もしていません(汗
557: 535 2021/10/30(土)17:48 ID:UiBk2jXZ(1) AAS
AMDの株がかなり上がったのでパソコン買っちゃいました!
画像リンク

558: 310 2021/10/30(土)22:23 ID:KcRkQNBB(1) AAS
パソコンうらやましす。
メモリー128Gで32スレッドくらい欲しいなぁ。

評価関数は結局ステージ分割にしています。が、学習途中でEigenがコケる。
なんとなくステージ単位での件数オーバーっぽいので、更にステージ分割を
細かくしてみていますが、今日1日の作業がパーで、また丸1日くらいかかる
のかなと。

まだ原因特定できた訳ではないし、件数が大丈夫かも判然としないので、また
こけないか心配ではあります。
559: 535 2021/10/31(日)18:56 ID:P/0PQ7su(1/2) AAS
Katagoですが、Katagoで使われてるpythonスクリプトはTensorflow 1.15を想定していて
Tensorflow 1.15はCUDA 10.0を想定していて、
RTX 3070 TiはCUDA 10.0をサポートしてない

ということらしい。
詰んだかも orz orz orz orz orz
560: 535 2021/10/31(日)20:00 ID:P/0PQ7su(2/2) AAS
藤井先生、竜王までいってしまうか。
7冠当選確実ですねー
561: 310 2021/10/31(日)23:27 ID:wMiG8knd(1) AAS
GPUにはそんな相性問題があるのですか…
色々調べてやらないとダメですね。

コケる原因と思われるところを見つけました。
色々やった挙句、矛盾した盤面がありそうだという事になって、調べたらビンゴ。
これからヨタプロ書いて、問題の棋譜を見つけて削除するつもり。

デバッグ中にさらに色々評価関数のを見つけてしまいました。
評価関数って多少バグってても、それっぽく学習しちゃうんだよねorz。
562: 310 2021/11/01(月)07:58 ID:dM9ZkTyW(1/2) AAS
多分解決。

棋譜の問題じゃなくてBook構築時の問題でした。
40手目までBook登録しているのですが、40手目以前に全滅した時の
終局判定が漏れていて、無いはずの矛盾した後続の盤面を作ってました。
普段は全く影響でないのですが、Bookまとめて読みだして処理をかける時
だけ出てくる奴です。

昨夜学習開始しましたが、まだ問題箇所を全部通過したわけではありません。
が、たぶん大丈夫だと思う。昼過ぎにはわかるはず。

Book再構築に1時間と、学習に丸1日以上かな。
明日の朝までには第一陣の学習が終わるかな?

まだ学習回数不足で評価値が安定していなので、バグが快勝していても、
しばらくは時間がかかりそうです。
563: 535 2021/11/01(月)19:33 ID:+SuiL1m9(1) AAS
NVIDIA製のDocker使うとRTX 3070 ti でも Tensorflow 1.15 使えるという記事がちらほらある。
ゴールは遠いなぁ。
564: 310 2021/11/01(月)23:01 ID:dM9ZkTyW(2/2) AAS
とりあえず問題箇所全クリアは確認できました。

エポック10回で1日半かかるのが面倒。
せめて50エポックくらいしたい。
今週は学習週刊になりそう。
565: 535 2021/11/02(火)20:13 ID:28WH20bm(1) AAS
Dockerにがっぷり4つで取り組むのちょっとしんどいなぁ
ペースを落としてのんびり行くか。
566: 535 2021/11/05(金)19:33 ID:AWXtKWsR(1/2) AAS
なんかwindows insider programとかいうのに入らないといけないらしくかなり敷居が高い。
いったん退却するか?
567: 535 2021/11/05(金)20:07 ID:AWXtKWsR(2/2) AAS
将棋は最高7冠じゃなくて8冠なんですねー
叡王忘れてた
568: 310 2021/11/05(金)20:47 ID:TX9UwcXB(1) AAS
心の迷いから、途中まで学習して止めて、ちょこっと修正してを繰り返してますのでまったく
学習が進んでいません。Bookチェック用コンソールでの浅い探索がびっくりするほど遅く
なってしまい、原因を探したりなんやかんややっていたのが迷いの原因です。

最終的にステージ分割を止めて、8対称を4対称に落として教師データを半分にしたりして
学習再開しました。1エポック1時間半でとりあえず30回学習させてみるという事で仕上がり
は日曜日の夕方〜夜の予定。まるまる1週間パーになりました。

もともと件数オーバーでメモリ溢れ始めたのは、4対称だったのを8対称に変えてからだった
ような気がしてきました。また、ステージ分割も、昔1回トライして、速度低下が酷くてやめ
ちゃった事があったような記憶もうっすら残っています。なんつーか、こういう類の手戻りが多いorz

ただ、探索がステージ分割だけで遅くなるとも思えないです。浅い探索は単純なαβで、
オーダリングはヒューリスティックスオンリーだし、ProbCutもしていないです。分割により
評価値ゼロとなる末端が多くてβカットが減っているのかなと思っています。間違っていて
も値が入っていればβカットはされますから。

棋譜作成にランダム要素加えて、悪手変化後の局面もたくさん学習させないといかんのかな。
569: 535 2021/11/06(土)21:09 ID:fJzqcDF5(1) AAS
NVIDIAのドライバ色々入れたらなんかパソコンの調子悪くなったorz
もーやめてくれー
570: 310 2021/11/06(土)21:44 ID:zi779w0E(1) AAS
なんか評価値がおかしかったのでチェックしていたら、末端ノードでの評価値の差分計算
がおかしくなっていた。もともとちゃんと動いていた箇所なので、何故変わっていたのか謎。

これも激遅の原因の一つではあると思うけど、まだ遅いんだよなぁ。
571: 535 2021/11/09(火)07:27 ID:V517zoPP(1) AAS
AMD株が凄いことになってる
572: 535 2021/11/13(土)10:00 ID:JzxMx88v(1/3) AAS
6x6タイルゲームに手を出し始めました
573: 535 2021/11/13(土)22:32 ID:JzxMx88v(2/3) AAS
藤井先生、竜王とったか
もう誰も止められんね
574: 535 2021/11/13(土)23:49 ID:JzxMx88v(3/3) AAS
藤井先生、竜王とったか
もう誰も止められんね
575: 310 2021/11/15(月)00:36 ID:hveDHfQn(1) AAS
藤井先生はAIだと思うようになりました(汗
新人王とった伊藤匠4段もかなり強いね。これから期待です。

評価関数学習し始めたら、オプティマイザーでSMORMS3は学習開始直後の集束は
滅茶苦茶早いんだけど、汎化が上手く行かないので、momentumと併用していたのを
思い出して、今はmomentumで毎晩6エポックづつ学習させてます。結構よくなって
きたけど、まだまだかなぁ。このまま続けたら速さは戻りそうですが…

それならステージ分割してまた学習やり直しても良いのではないかと思ってみても
良いのかなという気がし始めています(汗

途中、棋譜をほぼ全部飛ばしそうなバグ出してました。
たまたま戻せましたが、危ない危ない。
576: 310 2021/11/22(月)02:44 ID:EeZe+kFL(1) AAS
中盤探索劇遅の原因わかりました。

static constな関数をstatic constexprに変更していたのが原因のようです。
色々原因探して、最後の最後にまさかと思って、戻してもたら速度問題解消。

constexprにしたらコンパイル時定数扱いになると思っていたのですが何故?
577: 535 2021/12/04(土)16:31 ID:6uZ5YSAD(1) AAS
6x6オセロて完全解析されてるんですよね?
6x6タイルゲーム完全解析出来ないかなあ
578: 535 2021/12/12(日)11:39 ID:ZeZ8k4MF(1) AAS
タイルゲームですが、現局面の勝率をモンテカルロでしらべて4割以上6割以下ならノードを展開し以下再帰的に繰り返す、というのを考えたのですが、あんまり枝刈りの効率が良くなくてガッカリしてます。
1-
あと 58 レスあります
スレ情報 赤レス抽出 画像レス抽出 歴の未読スレ

ぬこの手 ぬこTOP 0.023s