ゲーマーLV90　人工知能編

ゲーマーLV90　人工知能編 (25ﾚｽ)
上下前次 1-新

1: ゲーマーLV90 ◆YYqXz1t7YA 2018/05/03(木)17:27 ID:aC7LfhT5(1/13) AAS
皆さんお久しぶりです
第三弾は人工知能
ゲームに使えるかもしれない単純な人工知能について良さそうな構想を思いついたのでぼちぼちやっていこうと思います

2: ゲーマーLV90 ◆YYqXz1t7YA 2018/05/03(木)17:31 ID:aC7LfhT5(2/13) AAS
簡単に言えば
学習データの作成後　学習データを使用し　行動
学習データとモードで行動に偏りを
表が完成すれば目的行動を取らせられる
こんな感じの人工知能ですね

それでは要素書いていきます

3: ゲーマーLV90 ◆YYqXz1t7YA 2018/05/03(木)17:38 ID:aC7LfhT5(3/13) AAS
状態＝報酬
01＝07
02＝08
03＝09
04＝10
05＝11
06＝12
07＝13
08＝14
09＝15
省18

4(1): ゲーマーLV90 ◆YYqXz1t7YA 2018/05/03(木)17:39 ID:aC7LfhT5(4/13) AAS
報酬＝報酬量
01＝−500
02＝−500
03＝−500
04＝−500
05＝−500
06＝−500
07＝−3
08＝−2
09＝−1
省16

5: ゲーマーLV90 ◆YYqXz1t7YA 2018/05/03(木)17:40 ID:aC7LfhT5(5/13) AAS
AA省

6: ゲーマーLV90 ◆YYqXz1t7YA 2018/05/03(木)17:42 ID:aC7LfhT5(6/13) AAS
横＝行動
縦＝状態
？＝報酬

　01020304050607080910111213
07？？？？？？？？？？？？？
08？？？？？？？？？？？？？
09？？？？？？？？？？？？？
10？？？？？？？？？？？？？
11？？？？？？？？？？？？？
12？？？？？？？？？？？？？
省7

7(1): ゲーマーLV90 ◆YYqXz1t7YA 2018/05/03(木)17:44 ID:aC7LfhT5(7/13) AAS
ずれてる(笑)

　　01　02　03　04　05　06　07　08　09　10　11　12　13
07　08　09　10　11　12　13　06　05　04　03　02　01　07
08　09　10　11　12　13　14　07　06　05　04　03　02　08
09　10　11　12　13　14　15　08　07　06　05　04　03　09
10　11　12　13　14　15　16　09　08　07　06　05　04　10
11　12　13　14　15　16　17　10　09　08　07　06　05　11
12　13　14　15　16　17　18　11　10　09　08　07　06　12
13　14　15　16　17　18　19　12　11　10　09　08　07　13
14　15　16　17　18　19　20　13　12　11　10　09　08　14
省5

8: ゲーマーLV90 ◆YYqXz1t7YA 2018/05/03(木)17:52 ID:aC7LfhT5(8/13) AAS
説明が失敗しそうな予感がする

状態＋行動＝報酬
状態　行動　効果　報酬　報酬量

状態13　行動13　効果13　報酬25　報酬量8

記憶
状態　行動　報酬量？　回数　上限

状態　認識　参照　行動　報酬　記憶
状態ｎの時に行動ｎをしたら報酬ｎが得られた

9: ゲーマーLV90 ◆YYqXz1t7YA 2018/05/03(木)17:53 ID:aC7LfhT5(9/13) AAS
モード
学習データ作成モード
状態に対して学習データを参照して
回数が少ない行動を取る　回数が同じ場合は　行動変数小さい順　や　行動01から順に
など

学習データ使用モード
状態に対して学習データを参照して
報酬が一番高く確率が高い行動を選択　確率が同じ場合新しいのを選択
や
スコアがｎ点になるように行動　ｎ点になったらその点数を維持
省1

10(1): ゲーマーLV90 ◆YYqXz1t7YA 2018/05/03(木)17:54 ID:aC7LfhT5(10/13) AAS
記憶上限
報酬複数や報酬変化に対応　など
上限超えた記憶を消すのが重要
上限少ない方が適応が速い
状態　行動　結果　回数＝％　上限
回数＝報酬を得た回数
古いのから消えていく
例　報酬複数
状態01＋行動01＝報酬01　50　100
状態01＋行動01＝報酬02　30　100
省12

11: ゲーマーLV90 ◆YYqXz1t7YA 2018/05/03(木)17:56 ID:aC7LfhT5(11/13) AAS
フェーズ　学習データ作成モード　ざっくり
モード＝状態に対して学習データを参照して
　　　　回数が少ない行動を取る　回数が同じ場合は　行動変数小さい順　や　行動01から順に

状態ランダムテーブルシャッフル
状態　テーブルの1番
状態認識
モード参照
行動
報酬獲得
記憶
省19

12: ゲーマーLV90 ◆YYqXz1t7YA 2018/05/03(木)17:58 ID:aC7LfhT5(12/13) AAS
とりあえず要素はこんな感じです
説明なしでも伝わるか時間置いてみようと思います

13(1): 2018/05/03(木)18:50 ID:lR8Sdj6R(1) AAS
報酬はどうやって決定するの？

14: ゲーマーLV90 ◆YYqXz1t7YA 2018/05/03(木)19:42 ID:aC7LfhT5(13/13) AAS
>>13
状態＋行動＝報酬です
あと>>4を見てもらえれば

15(1): 2018/05/04(金)22:18 ID:n9JbwOr3(1) AAS
学習データとは？ざっくりしすぎでは・・・

16: ゲーマーLV90 ◆YYqXz1t7YA 2018/05/05(土)00:10 ID:z96vZ9b+(1) AAS
>>15
>>7と>>10の例　報酬複数を見てもらえれば

17: 2018/05/08(火)12:51 ID:k5dyx4p9(1) AAS
レコメンドエンジンみたいだな

18: ゲーマーLV90 ◆YYqXz1t7YA 2018/05/08(火)14:12 ID:IzTxC8ab(1) AAS
レコメンドエンジンちょっと調べてみた

レコメンド
ALS(Alternative Least Squares=交互最小二乗法)とは行列分解の手法の1つ
を用いる
このスレも行列分解の手法の1つ？

協調フィルタリング
チェックまたは購入　類似性　相関分析　関連付け　提示

状態＋行動＝評価　このスレ
ユーザー＋アイテム＝レーティング　レコメンド

人の評価をすり合わせて評価の予測？　レコメンド
省8

19: 2018/05/19(土)21:41 ID:XUCzaMwj(1) AAS
今回はウディタでサンプル作らないの？

20: 2018/05/22(火)20:56 ID:z5Z1yyt2(1) AAS
張り切って酉まで付けたのにまた終わっちゃったねwwwww

上下前次 1-新書関写板覧索設栞歴

あと 5 ﾚｽあります
ｽﾚ情報赤ﾚｽ抽出画像ﾚｽ抽出歴の未読ｽﾚ AAｻﾑﾈｲﾙ

ぬこの手ぬこTOP 0.368s*