[過去ログ]
【統計分析】機械学習・データマイニング22 (1002レス)
【統計分析】機械学習・データマイニング22 http://mevius.5ch.net/test/read.cgi/tech/1547338417/
上
下
前
次
1-
新
通常表示
512バイト分割
レス栞
このスレッドは過去ログ倉庫に格納されています。
次スレ検索
歴削→次スレ
栞削→次スレ
過去ログメニュー
919: デフォルトの名無しさん (ワッチョイ 5e66-erI5) [sage] 2019/02/26(火) 20:43:24.25 ID:DUz4HSDe0 >>871 すみません、そのページを読んでみたのですが、まだ理解できません。 a に添字 b を下付きしたものを a_b と表すとして、 state-value function v_π(s) = E_π [G_t | S_t = s] を私は次のように式変形しました。 v_π(s) = E_π[R_(t+1) + γG_(t+1) | S_t = s] v_π(s) = E_π[R_(t+1) | S_t = s] + E_π[γG_(t+1) | S_t = s] 私が分からないのは第2項の期待値の計算です。 E_π[γG_(t+1) | S_t = s] = Σ_a π(a|s) Σ_s'r p(sr', r|s, a) (γG_(t+1)) このように展開できると思うのですが違いますか? http://mevius.5ch.net/test/read.cgi/tech/1547338417/919
メモ帳
(0/65535文字)
上
下
前
次
1-
新
書
関
写
板
覧
索
設
栞
歴
あと 83 レスあります
スレ情報
赤レス抽出
画像レス抽出
歴の未読スレ
Google検索
Wikipedia
ぬこの手
ぬこTOP
0.014s