[過去ログ]
【オセロ,将棋】ボードゲーム【囲碁,War】 (1002レス)
上
下
前
次
1-
新
このスレッドは過去ログ倉庫に格納されています。
次スレ検索
歴削→次スレ
栞削→次スレ
過去ログメニュー
977
:
310
2017/10/05(木)22:33
ID:sIPpafz3(1)
AA×
[240|
320
|
480
|
600
|
100%
|
GIF
|
べ
|
レス栞
|
レス消
]
977: 310 [sage] 2017/10/05(木) 22:33:23.90 ID:sIPpafz3 ポリシーの強化学習、遅々として進んでいます(汗 時々、テストでMCTS動かしてポリシーの学習値を見ているのですが、 学習対象の全48手のうち、後ろ12手分くらい、それっぽく濃淡がついてきてます。 このまま続けたら、もっと前の方まで学習してくれると期待しているのですが、ここ からが分岐が多い箇所なので、どれくらい時間がかかるか想像がつかない。 で、ポリシーの強化学習の結果を使って、バリューの方も学習させていたのですが、 やはり無理がある事に思い至りました。バリューはバリューで別途強化学習をさせ ないといけない模様。どちらかというとバリューの方が大事なので、このままポリシー の学習を続けるか、一旦棚上げしてバリューの方に乗り換えるか、悩み中。 学習中のポリシーをMCTSに組み込んだところ、速度低下が著しい。メモリーのランダム アクセスが原因だと思う。速度アップネタをいくつか模索してみたいと思いますが、 変更が重いので、いつやるかこちらも悩み中。 http://mevius.5ch.net/test/read.cgi/gamedev/1057763418/977
ポリシーの強化学習遅として進んでいます汗 時テストで動かしてポリシーの学習値を見ているのですが 学習対象の全48手のうち後ろ12手分くらいそれっぽく濃淡がついてきてます このまま続けたらもっと前の方まで学習してくれると期待しているのですがここ からが分岐が多い箇所なのでどれくらい時間がかかるか想像がつかない でポリシーの強化学習の結果を使ってバリューの方も学習させていたのですが やはり無理がある事に思い至りましたバリューはバリューで別途強化学習をさせ ないといけない模様どちらかというとバリューの方が大事なのでこのままポリシー の学習を続けるか一旦棚上げしてバリューの方に乗り換えるか悩み中 学習中のポリシーをに組み込んだところ速度低下が著しいメモリーのランダム アクセスが原因だと思う速度アップネタをいくつか模索してみたいと思いますが 変更が重いのでいつやるかこちらも悩み中
上
下
前
次
1-
新
書
関
写
板
覧
索
設
栞
歴
あと 25 レスあります
スレ情報
赤レス抽出
画像レス抽出
歴の未読スレ
ぬこの手
ぬこTOP
0.047s