[過去ログ]
【オセロ,将棋】ボードゲーム Part2【囲碁,War】 (1002レス)
【オセロ,将棋】ボードゲーム Part2【囲碁,War】 http://mevius.5ch.net/test/read.cgi/gamedev/1508056498/
上
下
前次
1-
新
通常表示
512バイト分割
レス栞
抽出解除
レス栞
このスレッドは過去ログ倉庫に格納されています。
次スレ検索
歴削→次スレ
栞削→次スレ
過去ログメニュー
17: 535 [sage] 2017/10/26(木) 00:13:05.87 ID:vVm7O/8N とりあえず、mnistのやつは正解をlabel_tで渡すみたいだけど 局面の勝率を正解にしたい場合はどうすればいいんだろう? ラベルと勝率じゃデータ構造違うよね多分? それとも同じなんだろうか… http://mevius.5ch.net/test/read.cgi/gamedev/1508056498/17
19: 名前は開発中のものです。 [sage] 2017/10/26(木) 09:53:53.13 ID:43FvyXwK >>17 mnistは、分類器(他クラス分類)なので、活性化関数はsoftmaxになり、教師データ はlabel_tで与えます。別にvec_tでも良いですが、例えば3という答えに対して、 label_tは{3}なのに対し、vec_tは{0,0,0,1,0,0,0,0,0,0}などとなって冗長なので、label_tが 用意されているわけです。他にも、誤差の計算方法が違うなんてのもあります。 一方、ゲームの勝敗予想は2値分類問題なので、活性化関数はsigmoidで、教師 データはvec_tとして、勝利を{1}、敗北を{0}として与えて学習させます。 オセロには引き分けがあるので、引き分けは{0.5}としてみましたが、勝率50%と引き 分けでは意味がまったく違うのが悩みの種です。2人ゼロ和完全情報ゲームでは 勝率50%というのは理論上存在しないのですが、強化学習の途中などでは生じます からね。 なお、tiny_dnnでは2値分類や回帰の学習には入力データも教師データもともにvec_t で与えてfitを用い学習します。mnistのような他クラス分類でlabel_tで教師データを与え、 学習をする時はtrainを使用します。 http://mevius.5ch.net/test/read.cgi/gamedev/1508056498/19
メモ帳
(0/65535文字)
上
下
前次
1-
新
書
関
写
板
覧
索
設
栞
歴
スレ情報
赤レス抽出
画像レス抽出
歴の未読スレ
AAサムネイル
Google検索
Wikipedia
ぬこの手
ぬこTOP
0.151s*