俺の中でUCB探索手法がロボットに使えるのではないかと話題に (14レス)
1-

1: 2015/09/30(水)19:01 ID:KK2(1) AAS
どうなのか
派生手法ありすぎてどれがいいのかもよく分からないが・・・

オリジナルのUCB?
外部リンク[pdf]:certis.enpc.fr
KL-UCB?
外部リンク[pdf]:jmlr.org
外部リンク[pdf]:www.cs.mcgill.ca
2
(1): 2015/09/30(水)19:51 ID:QQN(1) AAS
ユニコーンガンダムバズーカ
3: 2015/09/30(水)19:55 ID:vrk(1) AAS
>>2
それじゃUGBじゃ・・・
4: 2015/10/01(木)02:38 ID:tUS(1) AAS
三行で
5: 2015/10/01(木)03:57 ID:Biu(1) AAS
UCBとはランダムな報酬を与えてくれるバンディットマシーンをいかに効率よく報酬獲得率を推定しながら、
報酬を高く得るかを考えるための手法

さいきんはこれの派生手法としてUCTなるものが出てきて、囲碁がかなり強くなった
6: 2015/10/01(木)03:59 ID:EUV(1/2) AAS
海外の論文だとGoって囲碁が表記されててちょっと笑う
7: 2015/10/01(木)04:02 ID:EUV(2/2) AAS
UCTアルゴリズム
外部リンク[pdf]:minerva.cs.uec.ac.jp
外部リンク[pdf]:www.logos.ic.i.u-tokyo.ac.jp
外部リンク[html]:www.computer-igo.com
8: 2015/10/01(木)04:14 ID:AG8(1) AAS
他の探索手法と比べて何が違うのか3行
9: 2015/10/01(木)04:49 ID:Dhh(1) AAS
UCTは受け取れる平均報酬を最大化することを考えて行動する
理論的に平均報酬を最大化する工夫を入れてある
だから探索と報酬獲得のバランスがいい
10: 2015/10/01(木)16:51 ID:JQ7(1) AAS
ロボット応用はまだそんなにないよな?
11: 2015/10/02(金)00:41 ID:C4i(1) AAS
探索手法でドローン飛ばしてる研究はuctだった気がする
12: 2015/10/02(金)01:02 ID:Fff(1) AAS
将棋もuctなの?
13: 2015/10/02(金)01:51 ID:nZL(1) AAS
へーよくわからんけどすげーのかな?
14: 2015/10/04(日)14:02 ID:rly(1) AAS
強化学習と相性がいいとか
1-
スレ情報 赤レス抽出 画像レス抽出 歴の未読スレ AAサムネイル

ぬこの手 ぬこTOP 0.004s