[過去ログ]
【オセロ,将棋】ボードゲーム【囲碁,War】 (1002レス)
上
下
前
次
1-
新
このスレッドは過去ログ倉庫に格納されています。
次スレ検索
歴削→次スレ
栞削→次スレ
過去ログメニュー
737
:
310
2017/02/20(月)20:05
ID:L40mCRWI(1/2)
AA×
[240|
320
|
480
|
600
|
100%
|
JPG
|
べ
|
レス栞
|
レス消
]
737: 310 [sage] 2017/02/20(月) 20:05:00.30 ID:L40mCRWI 論文自体はだいぶ前にダウンロードしてたんですが(汗 MCTSやらない段階では、やはり理解は難しかったと思います。 DCNN部分の投入データあたりは囲碁の知識が必要だったりしますので、 まだよくわからない点が多いです。 で、MCTS的な視点から眺めると、巷の解説とは違うところにフォーカスが あたったりします。強化学習使ったRL PolicyはValue netの事前学習で 使っていますが、プレイアウトの手の選択では線形Softmax、ノードの分岐 では教師付学習のものを使用しているなど、工夫が見られまして。オセロ は既に評価関数があるので、無理やりDCNNしなくても応用が効くのでは ないかと思ったりします。 とはいえ、今学習中の奴は、学習終わるまで1ヶ月くらいかかりそうではあり ますが、どこまで手の一致率が高められるか、見てみたい気もしています。 http://mevius.5ch.net/test/read.cgi/gamedev/1057763418/737
論文自体はだいぶ前にダウンロードしてたんですが汗 やらない段階ではやはり理解は難しかったと思います 部分の投入データあたりは囲碁の知識が必要だったりしますので まだよくわからない点が多いです で的な視点から眺めると巷の解説とは違うところにフォーカスが あたったりします強化学習使った は の事前学習で 使っていますがプレイアウトの手の選択では線形ノードの分岐 では教師付学習のものを使用しているなど工夫が見られましてオセロ は既に評価関数があるので無理やりしなくても応用が効くのでは ないかと思ったりします とはいえ今学習中の奴は学習終わるまで1ヶ月くらいかかりそうではあり ますがどこまで手の一致率が高められるか見てみたい気もしています
上
下
前
次
1-
新
書
関
写
板
覧
索
設
栞
歴
あと 265 レスあります
スレ情報
赤レス抽出
画像レス抽出
歴の未読スレ
ぬこの手
ぬこTOP
0.039s