レス書き込み
スレへ戻る
写
レス栞
レス消
【統計分析】機械学習・データマイニング22
PC,スマホ,PHSは
ULA
べっかんこ
公式(スマホ)
公式(PC)
で書き込んでください。
名前
メール
引用切替:
レスアンカーのみ
>>870 > 強化学習の state-value の式について質問です。 > スレチでしたらご指摘ください。 > > 「Reinforcement Learning: An Introduction」のPDFを読んでいます。 > http://incompleteideas.net/sutton/book/the-book-2nd.html > > 59ページ目にstate-valueが自己再帰の形で表せる事を示した式がありますが、 > この式の2行目から3行目に式変形できる理由が分かりません。 > > 角括弧の中の Rt+1 が r になるのは分かるのですが、 > なぜ Gt+1 が Eπ[G+1 | St+1 = s'] になるのでしょうか。 > > この辺りのことを説明したwebページや書籍の紹介だけでも構いません。
ローカルルール
SETTING.TXT
他の携帯ブラウザのレス書き込みフォームはこちら。
書き込み設定
で書き込みサイトの設定ができます。
・
ULA
・
べっかんこ(身代わりの術)
・
べっかんこ(通常)
・
公式(スマホ)
・
公式(PC)[PC,スマホ,PHS可]
書き込み設定(板別)
で板別の名前とメールを設定できます。
メモ帳
(0/65535文字)
上
下
板
覧
索
設
栞
歴
Google検索
Wikipedia
ぬこの手
ぬこTOP
0.010s