【オセロ,将棋】ボードゲーム Part3【囲碁,War】

【オセロ,将棋】ボードゲーム Part3【囲碁,War】 (636ﾚｽ)
上下前次1-新
抽出解除ﾚｽ栞

ﾘﾛｰﾄﾞ規制です｡10分ほどで解除するので､他のﾌﾞﾗｳｻﾞへ避難してください｡

78: 535 [sage] 2020/01/28(火) 21:14:35.23 ID:/HMe/KRT(1) AAS
やっぱ教科書の通り実装しようとするよりも自分でアイディアひねり出そうともがくほうが楽しいなぁ。
教科書が大事じゃないとは言わないけど、なによりモチベが全ての活動の源泉だからな。

132: 310 [sage] 2020/02/23(日) 01:08:08.23 ID:9FygPBnT(2/4) AAS
>>127

127(2): 310 [sage] 2020/02/22(土) 21:32:51.12 ID:wHsEFeMN(1) AAS
間違える局面が特定できているて、間違えた手を訂正できるんなら、
訂正後から対戦再開させて、その棋譜で局面DB更新して、学習するとか。

特定できていなくても、基本強化学習は、対戦→DB更新＆学習の
繰り返しで、徐々に間違いを訂正していく方法。もうちょっと工夫する
ならε-Greedyなどの手法で既存の棋譜の途中で無理やり別の手に
分岐させていく。その手が悪くても、「悪い手である」という認識を学習
させる事ができる。

線形計画だとモデルが上手くできていないと学習が飽和しちゃうけど、
DNNだったらある程度うまく学習してくれるかも。

に捕捉しとくと、

自分はGreedyな手法の精度をあげるために、浅い探索（９手）と組み合わせて、
評価値が少しだけ悪い手とか、Book登録ないのに評価値が良いとか、いくつかの
基準の訂正ロジックを作って、明らかに悪い手を排除したGreedy法をとって、
既存の棋譜に対して順次分岐を生成していく事で、Bookを埋めて行っています。

分岐は１３手読みで作成していますが、この分岐も間違いがそれなりにあるため、
間違いを積み上げているのではないかという懸念もあります（汗

オセロの場合、黒白両者とも最善の場合、引き分けに収束する可能性が濃厚なため
初手から最善引き分けとなるツリーについては、先頭側からこのGreedy法で分岐を
生成し、また（後ろから）確定読み切りを優先して実行する事で、引き分け手順だけ
優先的に精度を上げています。

評価関数作るのに、こういう制約をつけた方法が良いのかは不明です。現に極端に
形勢が傾いた盤面の読み切りは、学習データが不足しているために、引き分け盤面
よりずっと時間がかかるように感じています。

328(2): 535 [sage] 2020/07/04(土) 11:25:12.23 ID:aqVM5XYH(1) AAS
そこに打ったらn手以内に反撃で取られてしまうか？を判定するルーチンを書いてAIに組み込んだら、かなり動きがよくなった。

413: 535 [sage] 2021/01/24(日) 08:14:24.23 ID:t0z9Z/qG(1/3) AAS
ＡＩ結構つよくなったかも。
勝てないわけじゃないけど負かされるときは大差で負かされるというなかなか面白いＡＩができた。
思考時間も超サクサクだしかなりいい感じ。
１００世代くらい学習させてみたいな。

583: 535 [sage] 2022/01/21(金) 19:44:40.23 ID:XbtJM6do(1) AAS
AMD株下がってきたT△T
まだ利確してませんorz

614: 535 [sage] 2023/01/09(月) 18:25:52.23 ID:5ce5WSNU(1) AAS
羽生さんダメか。。。

621: 名前は開発中のものです。 [] 2023/02/11(土) 15:22:34.23 ID:d8z9qATr(1) AAS
負けても次は勝って追い付く。
それが2回も続く。
これは追われてるほうはプレッシャーを強く感じる。
次は後手番が勝ちそうな雰囲気になってきたな。
流れは完全に森内。

上下前次1-新書関写板覧索設栞歴

ｽﾚ情報赤ﾚｽ抽出画像ﾚｽ抽出歴の未読ｽﾚ AAｻﾑﾈｲﾙ

ぬこの手ぬこTOP 0.054s