【統計分析】機械学習・データマイニング22

[過去ﾛｸﾞ] 【統計分析】機械学習・データマイニング22 (1002ﾚｽ)
上下前次1-新
抽出解除必死ﾁｪｯｶｰ(本家) (べ) 自ID ﾚｽ栞あぼーん

このｽﾚｯﾄﾞは過去ﾛｸﾞ倉庫に格納されています｡
次ｽﾚ検索歴削→次ｽﾚ栞削→次ｽﾚ過去ﾛｸﾞﾒﾆｭｰ

ﾘﾛｰﾄﾞ規制です｡10分ほどで解除するので､他のﾌﾞﾗｳｻﾞへ避難してください｡

870: (ﾜｯﾁｮｲ 5e66-erI5) 2019/02/23(土)13:49 ID:px1wMGql0(1) AAS
強化学習の state-value の式について質問です。
スレチでしたらご指摘ください。

「Reinforcement Learning: An Introduction」のPDFを読んでいます。
外部ﾘﾝｸ[html]:incompleteideas.net

59ページ目にstate-valueが自己再帰の形で表せる事を示した式がありますが、
この式の2行目から3行目に式変形できる理由が分かりません。

角括弧の中の Rt+1 が r になるのは分かるのですが、
なぜ Gt+1 が Eπ[G+1 | St+1 = s'] になるのでしょうか。

この辺りのことを説明したwebページや書籍の紹介だけでも構いません。

上下前次1-新書関写板覧索設栞歴

ｽﾚ情報赤ﾚｽ抽出画像ﾚｽ抽出歴の未読ｽﾚ

ぬこの手ぬこTOP 0.034s