[過去ログ]
【統計分析】機械学習・データマイニング22 (1002レス)
上
下
前
次
1-
新
このスレッドは過去ログ倉庫に格納されています。
次スレ検索
歴削→次スレ
栞削→次スレ
過去ログメニュー
919
:
(ワッチョイ 5e66-erI5)
2019/02/26(火)20:43
ID:DUz4HSDe0(1)
AA×
>>871
[240|
320
|
480
|
600
|
100%
|
JPG
|
べ
|
レス栞
|
レス消
]
919: (ワッチョイ 5e66-erI5) [sage] 2019/02/26(火) 20:43:24.25 ID:DUz4HSDe0 >>871 すみません、そのページを読んでみたのですが、まだ理解できません。 a に添字 b を下付きしたものを a_b と表すとして、 state-value function v_π(s) = E_π [G_t | S_t = s] を私は次のように式変形しました。 v_π(s) = E_π[R_(t+1) + γG_(t+1) | S_t = s] v_π(s) = E_π[R_(t+1) | S_t = s] + E_π[γG_(t+1) | S_t = s] 私が分からないのは第2項の期待値の計算です。 E_π[γG_(t+1) | S_t = s] = Σ_a π(a|s) Σ_s'r p(sr', r|s, a) (γG_(t+1)) このように展開できると思うのですが違いますか? http://mevius.5ch.net/test/read.cgi/tech/1547338417/919
すみませんそのページを読んでみたのですがまだ理解できません に添字 を下付きしたものを と表すとして を私は次のように式変形しました 私が分からないのは第項の期待値の計算です このように展開できると思うのですが違いますか?
上
下
前
次
1-
新
書
関
写
板
覧
索
設
栞
歴
あと 83 レスあります
スレ情報
赤レス抽出
画像レス抽出
歴の未読スレ
ぬこの手
ぬこTOP
0.022s