【オセロ,将棋】ボードゲーム Part3【囲碁,War】 (636レス)
上
下
前
次
1-
新
131
(1)
:
310
2020/02/23(日)00:56
ID:9FygPBnT(1/4)
AA×
[
240
|
320
|
480
|600|
100%
|
JPG
|
べ
|
レス栞
|
レス消
]
131: 310 [sage] 2020/02/23(日) 00:56:57.70 ID:9FygPBnT 間違い探しを続けるうちに、何故Zebraの評価値の方がまともに見えるか問題に 突き当りました。で、評価関数を手数毎に60種類に分割している事で、学習データ が不足しているとか、スムージングしていないために、2手前の自分の番の盤面との 差分が取れないとかの問題があるのかなぁと思い立ちまして…。 また、4対称採用した事で学習時間も4倍になってしまいまして…。 思い切って、評価関数を1つにまとめてみたらどうだろうと思い立って、専用の学習 プロジェクトを作ってやってみました。通常数百回学習しないとまともな学習ができ ないのですが、20回学習したところで、意外とフィットしてしまいました。学習時間も 少し減ってる気がする。 一旦評価関数の癖を変えたほうが強化学習も進むかなと思い、とりあえず本番採用 してみました。気持ち速度も速くなった気がしています。もっとも、評価関数の学習具合 によってαβのorderingも変わって速度が変わったりするので、今後学習を積み重ね て、過学習気味になったりした時にどうなるのかは不明。 これから数日動かしてみて、良かったらこっちにしようかと思います。強いオセロAIを 作るのなら、対戦してどっちが強いとかやるのが本来なのですが、特にそういう目標も 現状あるわけでなし(汗 http://mevius.5ch.net/test/read.cgi/gamedev/1574503798/131
間違い探しを続けるうちに何故の評価値の方がまともに見えるか問題に 突き当りましたで評価関数を手数毎に60種類に分割している事で学習データ が不足しているとかスムージングしていないために2手前の自分の番の盤面との 差分が取れないとかの問題があるのかなぁと思い立ちまして また4対称採用した事で学習時間も4倍になってしまいまして 思い切って評価関数を1つにまとめてみたらどうだろうと思い立って専用の学習 プロジェクトを作ってやってみました通常数百回学習しないとまともな学習ができ ないのですが20回学習したところで意外とフィットしてしまいました学習時間も 少し減ってる気がする 一旦評価関数の癖を変えたほうが強化学習も進むかなと思いとりあえず本番採用 してみました気持ち速度も速くなった気がしていますもっとも評価関数の学習具合 によってのも変わって速度が変わったりするので今後学習を積み重ね て過学習気味になったりした時にどうなるのかは不明 これから数日動かしてみて良かったらこっちにしようかと思います強いオセロを 作るのなら対戦してどっちが強いとかやるのが本来なのですが特にそういう目標も 現状あるわけでなし汗
上
下
前
次
1-
新
書
関
写
板
覧
索
設
栞
歴
あと 505 レスあります
スレ情報
赤レス抽出
画像レス抽出
歴の未読スレ
ぬこの手
ぬこTOP
0.055s