[過去ログ]
【オセロ,将棋】ボードゲーム【囲碁,War】 (1002レス)
【オセロ,将棋】ボードゲーム【囲碁,War】 http://mevius.5ch.net/test/read.cgi/gamedev/1057763418/
上
下
前次
1-
新
通常表示
512バイト分割
レス栞
抽出解除
必死チェッカー(本家)
(べ)
自ID
レス栞
あぼーん
このスレッドは過去ログ倉庫に格納されています。
次スレ検索
歴削→次スレ
栞削→次スレ
過去ログメニュー
737: 310 [sage] 2017/02/20(月) 20:05:00.30 ID:L40mCRWI 論文自体はだいぶ前にダウンロードしてたんですが(汗 MCTSやらない段階では、やはり理解は難しかったと思います。 DCNN部分の投入データあたりは囲碁の知識が必要だったりしますので、 まだよくわからない点が多いです。 で、MCTS的な視点から眺めると、巷の解説とは違うところにフォーカスが あたったりします。強化学習使ったRL PolicyはValue netの事前学習で 使っていますが、プレイアウトの手の選択では線形Softmax、ノードの分岐 では教師付学習のものを使用しているなど、工夫が見られまして。オセロ は既に評価関数があるので、無理やりDCNNしなくても応用が効くのでは ないかと思ったりします。 とはいえ、今学習中の奴は、学習終わるまで1ヶ月くらいかかりそうではあり ますが、どこまで手の一致率が高められるか、見てみたい気もしています。 http://mevius.5ch.net/test/read.cgi/gamedev/1057763418/737
738: 310 [sage] 2017/02/20(月) 20:09:54.18 ID:L40mCRWI 追記。なんか格好良く書きすぎですね。 ちょうど今MCTSで悩んでいる箇所に見事な回答を与えている点に感動。 日本語で読めたので、そこに速攻で気づく事ができたという事で。 とはいえ、アルファ碁の線形SoftmaxによるRollout関数の入力データは、 囲碁の特性がわからない事から、意味不明な事もまだあり、いずれにして もそのままでは使え無さそうで、オセロに合わせて別途考えるしかなさそうです。 http://mevius.5ch.net/test/read.cgi/gamedev/1057763418/738
メモ帳
(0/65535文字)
上
下
前次
1-
新
書
関
写
板
覧
索
設
栞
歴
スレ情報
赤レス抽出
画像レス抽出
歴の未読スレ
AAサムネイル
Google検索
Wikipedia
ぬこの手
ぬこTOP
1.940s*