ゲーマーLV90 人工知能編 (25レス)
上
下
前
次
1-
新
10
(1)
:
ゲーマーLV90 ◆YYqXz1t7YA
2018/05/03(木)17:54
ID:aC7LfhT5(10/13)
AA×
[240|
320
|
480
|
600
|
100%
|
JPG
|
べ
|
レス栞
|
レス消
]
10: ゲーマーLV90 ◆YYqXz1t7YA [sage] 2018/05/03(木) 17:54:23.34 ID:aC7LfhT5 記憶上限 報酬複数や報酬変化に対応 など 上限超えた記憶を消すのが重要 上限少ない方が適応が速い 状態 行動 結果 回数=% 上限 回数=報酬を得た回数 古いのから消えていく 例 報酬複数 状態01+行動01=報酬01 50 100 状態01+行動01=報酬02 30 100 状態01+行動01=報酬03 20 100 状態+行動=報酬 の表の作成と使用 表の作成=学習 表の使用=予測 状態ランダムテーブルシャッフル 09 08 07 04 05 06 03 02 01 10 13 12 11 など 13回状態変えたらシャッフル 一応確率式でも可能だけど確率式だと学習漏れする可能性がある 100÷13=約7.69% 01から13まで各状態7.69%とかだと学習漏れの可能性 学習率 学習率100%=表の完成? 確率的な場合 表が完成しない場合もある 記憶上限も関係? http://mevius.5ch.net/test/read.cgi/gamedev/1525336024/10
記憶上限 報酬複数や報酬変化に対応 など 上限超えた記憶を消すのが重要 上限少ない方が適応が速い 状態 行動 結果 回数 上限 回数報酬を得た回数 古いのから消えていく 例 報酬複数 状態行動報酬 状態行動報酬 状態行動報酬 状態行動報酬 の表の作成と使用 表の作成学習 表の使用予測 状態ランダムテーブルシャッフル など 回状態変えたらシャッフル 一応確率式でも可能だけど確率式だと学習漏れする可能性がある 約 からまで各状態とかだと学習漏れの可能性 学習率 学習率表の完成? 確率的な場合 表が完成しない場合もある 記憶上限も関係?
上
下
前
次
1-
新
書
関
写
板
覧
索
設
栞
歴
あと 15 レスあります
スレ情報
赤レス抽出
画像レス抽出
歴の未読スレ
ぬこの手
ぬこTOP
0.043s