[過去ログ]
【オセロ,将棋】ボードゲーム【囲碁,War】 (1002レス)
上
下
前
次
1-
新
このスレッドは過去ログ倉庫に格納されています。
次スレ検索
歴削→次スレ
栞削→次スレ
過去ログメニュー
735
:
310
2017/02/19(日)20:31
ID:PM1ZzNLK(1)
AA×
[
240
|
320
|
480
|600|
100%
|
GIF
|
べ
|
レス栞
|
レス消
]
735: 310 [sage] 2017/02/19(日) 20:31:51.68 ID:PM1ZzNLK DCNNで学習させてるのですが、あまりに時間がかかるので、裏でもう一度 アルファ碁の論文を。日本語解説ページがいくつかできていて助かります。 で、読んでいたら、ロールアウトポリシーなる線形Softmaxでプレイアウトの 手を選択していると・・・。つまりはオセロ評価関数のような特徴を渡して、線形 回帰の代わりに出力をSoftmaxで確率分布にしたものです。 ロールアウトポリシーは棋譜との一致率が25%程度だけど、計算が圧倒的 に速く、このばらけ具合がちょうど良いとの事。 むむむ。アルファ碁はプレイアウトの手の選択にDCNN使ってないのねorz 日本語解説のおかげで、MCTS部の構造もようやくわかった。 いくらマシンが早くても無理だろと思っていた計算も、これなら何とかなりそう レベルの構造に落とし込まれていて、納得しました。 でも、実はまだインプットに何を食わせているのかが、よくわからない(汗 http://mevius.5ch.net/test/read.cgi/gamedev/1057763418/735
で学習させてるのですがあまりに時間がかかるので裏でもう一度 アルファ碁の論文を日本語解説ページがいくつかできていて助かります で読んでいたらロールアウトポリシーなる線形でプレイアウトの 手を選択しているとつまりはオセロ評価関数のような特徴を渡して線形 回帰の代わりに出力をで確率分布にしたものです ロールアウトポリシーは棋譜との一致率が25程度だけど計算が圧倒的 に速くこのばらけ具合がちょうど良いとの事 むむむアルファ碁はプレイアウトの手の選択に使ってないのね 日本語解説のおかげで部の構造もようやくわかった いくらマシンが早くても無理だろと思っていた計算もこれなら何とかなりそう レベルの構造に落とし込まれていて納得しました でも実はまだインプットに何を食わせているのかがよくわからない汗
上
下
前
次
1-
新
書
関
写
板
覧
索
設
栞
歴
あと 267 レスあります
スレ情報
赤レス抽出
画像レス抽出
歴の未読スレ
ぬこの手
ぬこTOP
0.040s