[過去ログ]
【オセロ,将棋】ボードゲーム【囲碁,War】 (1002レス)
上
下
前
次
1-
新
このスレッドは過去ログ倉庫に格納されています。
次スレ検索
歴削→次スレ
栞削→次スレ
過去ログメニュー
823
:
310
2017/05/08(月)23:27
ID:Byk3wJkT(1)
AA×
[240|
320
|
480
|
600
|
100%
|
JPG
|
べ
|
レス栞
|
レス消
]
823: 310 [sage] 2017/05/08(月) 23:27:34.27 ID:Byk3wJkT 悩ましいところですね。偏った棋譜を学習させるべきか、否か。 相手も弱いから、偏った棋譜になるわけで、そういう時にも問題が起きないように 探索と組み合わせるわけで。そう考えたら、そのままで良いのかも知れないし、 やってみないとわからないかも。自分的には、MCTSにおいてモンテカルロの 問題(隘路の騙し構造)に対して、先に避けるために、選択肢を偏らせるモノだと 認識していますので、拮抗している時に正しい手を返せばよいかと思っています。 自分は、Buroさんの特徴量をベースにしたMLPで評価関数作っているのだけど、 傾向としては線形回帰と変わらない印象です。与えている元データの偏りなのか、 それとも特徴量の選択の問題なのか、悩み中です。DCNNで特徴量抽出まで やらせたいと、をもう一度試そうかなと言う機運になってます。 ただ、頭の中に、ワンチップマイコンで学習外だしというのがチラついていまして、 そこに入り込むと数か月、下手したら半年はとられるなぁと悶々中。 そうそう。アルファ碁のバリューネットの勝率ですが、割引率を考えたら… という点に思い至りまして。普通勝率の評価関数はロクなもんじゃないのですが、 強化学習とセットなら、ありかもとちょっと思っています。 http://mevius.5ch.net/test/read.cgi/gamedev/1057763418/823
悩ましいところですね偏った棋譜を学習させるべきか否か 相手も弱いから偏った棋譜になるわけでそういう時にも問題が起きないように 探索と組み合わせるわけでそう考えたらそのままで良いのかも知れないし やってみないとわからないかも自分的にはにおいてモンテカルロの 問題路のし構造に対して先に避けるために選択肢を偏らせるモノだと 認識していますので抗している時に正しい手を返せばよいかと思っています 自分はさんの特徴量をベースにしたで評価関数作っているのだけど 傾向としては線形回帰と変わらない印象です与えている元データの偏りなのか それとも特徴量の選択の問題なのか悩み中ですで特徴量抽出まで やらせたいとをもう一度試そうかなと言う機運になってます ただ頭の中にワンチップマイコンで学習外だしというのがチラついていまして そこに入り込むと数か月下手したら半年はとられるなぁと悶中 そうそうアルファ碁のバリューネットの勝率ですが割引率を考えたら という点に思い至りまして普通勝率の評価関数はロクなもんじゃないのですが 強化学習とセットならありかもとちょっと思っています
上
下
前
次
1-
新
書
関
写
板
覧
索
設
栞
歴
あと 179 レスあります
スレ情報
赤レス抽出
画像レス抽出
歴の未読スレ
ぬこの手
ぬこTOP
0.040s