ゲーマーLV90 人工知能編 (25レス)
上下前次1-新
11: ゲーマーLV90 ◆YYqXz1t7YA 2018/05/03(木)17:56 ID:aC7LfhT5(11/13) AAS
フェーズ 学習データ作成モード ざっくり
モード=状態に対して学習データを参照して
回数が少ない行動を取る 回数が同じ場合は 行動変数小さい順 や 行動01から順に
状態ランダムテーブルシャッフル
状態 テーブルの1番
状態認識
モード参照
行動
報酬獲得
記憶
状態 テーブルの2番
状態認識
モード参照
行動
報酬獲得
記憶
テーブル13まで終わったら
状態ランダムテーブルシャッフル
状態 テーブルの1番
状態認識
モード参照
行動
報酬獲得
記憶
13×13=169 で表完成
フェーズ 学習データ使用モード ざっくり
モード=状態に対して学習データを参照して
報酬が一番高く確率が高い行動を選択 確率が同じ場合新しいのを選択
状態nに対して作成した表の行動13を選択でモードの表現
上下前次1-新書関写板覧索設栞歴
あと 14 レスあります
スレ情報 赤レス抽出 画像レス抽出 歴の未読スレ
ぬこの手 ぬこTOP 0.014s