[過去ログ]
知能研究スレ2©2ch.net (224レス)
知能研究スレ2©2ch.net http://rio2016.5ch.net/test/read.cgi/future/1481407726/
上
下
前
次
1-
新
通常表示
512バイト分割
レス栞
このスレッドは過去ログ倉庫に格納されています。
次スレ検索
歴削→次スレ
栞削→次スレ
過去ログメニュー
173: >>172 [sage] 2018/08/27(月) 09:48:40.33 ID:Zq8VRJ9K sssp://img.5ch.net/ico/nida.gif 0 10 20 30 0 250 500 750 1000 1250 1500 1750 2000 エピソードごとの外来報酬 勾配の更新の数 (a)大きなバッチ付きマリオ 128環境のバッチ バッチ1024環境 フレーム数(単位:百万) (b)ジャグリング(Roboschool) 純粋な好奇心(無報酬、無限遠地平線)探査 ジャグリング(Roboschool) フレーム数(単位:百万) (c)2人用ポン 純粋な好奇心(無報酬、無限遠地平線)探査 2人のポン 図3: (a)Left:MarioのRFメソッドと異なるバッチサイズの比較。 結果は外的報酬を使用しない。 (b)センター:ジャグリング(Roboschool)環境におけるボールのバウンス数。 (c)右:マルチプレイPong環境におけるエピソード長の平均。 The discontinuous jump on the graph corresponds to the agent reaching a limit of the environment - グラフ上の不連続なジャンプは、エージェントが環境の限界に達することに対応します。 after a certain number of steps in the environment the Atari Pong emulator starts randomly cycling through background colors and becomes unresponsive to agent 's actions 環境内の特定のステップ数の後で、Atari Pongエミュレータは背景色をランダムに循環し始め、エージェントのアクションに応答しなくなります http://rio2016.5ch.net/test/read.cgi/future/1481407726/173
メモ帳
(0/65535文字)
上
下
前
次
1-
新
書
関
写
板
覧
索
設
栞
歴
あと 51 レスあります
スレ情報
赤レス抽出
画像レス抽出
歴の未読スレ
AAサムネイル
Google検索
Wikipedia
ぬこの手
ぬこTOP
0.020s