[過去ログ]
【統計分析】機械学習・データマイニング22 (1002レス)
【統計分析】機械学習・データマイニング22 http://mevius.5ch.net/test/read.cgi/tech/1547338417/
上
下
前次
1-
新
通常表示
512バイト分割
レス栞
抽出解除
レス栞
このスレッドは過去ログ倉庫に格納されています。
次スレ検索
歴削→次スレ
栞削→次スレ
過去ログメニュー
リロード規制
です。10分ほどで解除するので、
他のブラウザ
へ避難してください。
871: デフォルトの名無しさん (アウウィフ FF21-kEY9) [] 2019/02/23(土) 16:12:58.09 ID:lNz7SHfNF P.48 P.55 P.73-75 http://mevius.5ch.net/test/read.cgi/tech/1547338417/871
919: デフォルトの名無しさん (ワッチョイ 5e66-erI5) [sage] 2019/02/26(火) 20:43:24.25 ID:DUz4HSDe0 >>871 すみません、そのページを読んでみたのですが、まだ理解できません。 a に添字 b を下付きしたものを a_b と表すとして、 state-value function v_π(s) = E_π [G_t | S_t = s] を私は次のように式変形しました。 v_π(s) = E_π[R_(t+1) + γG_(t+1) | S_t = s] v_π(s) = E_π[R_(t+1) | S_t = s] + E_π[γG_(t+1) | S_t = s] 私が分からないのは第2項の期待値の計算です。 E_π[γG_(t+1) | S_t = s] = Σ_a π(a|s) Σ_s'r p(sr', r|s, a) (γG_(t+1)) このように展開できると思うのですが違いますか? http://mevius.5ch.net/test/read.cgi/tech/1547338417/919
メモ帳
(0/65535文字)
上
下
前次
1-
新
書
関
写
板
覧
索
設
栞
歴
スレ情報
赤レス抽出
画像レス抽出
歴の未読スレ
Google検索
Wikipedia
ぬこの手
ぬこTOP
0.034s