[過去ログ]
【オセロ,将棋】ボードゲーム Part2【囲碁,War】 (1002レス)
上
下
前
次
1-
新
このスレッドは過去ログ倉庫に格納されています。
次スレ検索
歴削→次スレ
栞削→次スレ
過去ログメニュー
84
:
310
2017/11/17(金)23:19
ID:0nQ3gtJu(1)
AA×
[
240
|
320
|
480
|600|
100%
|
JPG
|
べ
|
レス栞
|
レス消
]
84: 310 [sage] 2017/11/17(金) 23:19:33.73 ID:0nQ3gtJu 浅い探索付き強化学習は結構有効に機能しているようです。 学習の速度が明らかに上がったし、精度も良くなっているようで、テスト盤面の 誤差が結構減りました。ただ、そろそろ飽和したか、局所解に入ったような印象。 で、色々考えたあげく、線形回帰ではこの辺が限界かもしれないという事で、 評価関数をmlpにしてみました。valueの方がうまく学習しなかったので、回帰型 ではなくsigmoid出力にして0〜1の数字を石差に変換かけてます。 強化学習は、回帰版の評価関数の結果をそのまま利用してます。 そろそろそこそこ使えそうな誤差になってきたようだし、強化学習は自分に対して 行った方が良いはずなので、全面的にmlpに移行しちゃおうか悩み中。 http://mevius.5ch.net/test/read.cgi/gamedev/1508056498/84
浅い探索付き強化学習は結構有効に機能しているようです 学習の速度が明らかに上がったし精度も良くなっているようでテスト盤面の 誤差が結構減りましたただそろそろ飽和したか局所解に入ったような印象 で色考えたあげく線形回帰ではこの辺が限界かもしれないという事で 評価関数をにしてみましたの方がうまく学習しなかったので回帰型 ではなく出力にして01の数字を石差に変換かけてます 強化学習は回帰版の評価関数の結果をそのまま利用してます そろそろそこそこ使えそうな誤差になってきたようだし強化学習は自分に対して 行った方が良いはずなので全面的にに移行しちゃおうか悩み中
上
下
前
次
1-
新
書
関
写
板
覧
索
設
栞
歴
あと 918 レスあります
スレ情報
赤レス抽出
画像レス抽出
歴の未読スレ
ぬこの手
ぬこTOP
0.039s