- -pv
スレッドの閲覧状況:
現在、- がスレを見ています。
これまでに合計 - 表示されました。
※PC・スマホの表示回数をカウントしてます。
※24時間表示がないスレのPVはリセットされます。

俺の中でUCB探索手法がロボットに使えるのではないかと話題に

1名無しさん@おーぷん:2015/09/30(水)19:01:44 ID:KK2()
どうなのか
派生手法ありすぎてどれがいいのかもよく分からないが・・・

オリジナルのUCB?
http://certis.enpc.fr/~audibert/Mes%20articles/TCS08.pdf
KL-UCB?
http://jmlr.org/proceedings/papers/v22/kaufmann12/kaufmann12.pdf
http://www.cs.mcgill.ca/~vkules/bandits.pdf
2名無しさん@おーぷん :2015/09/30(水)19:51:27 ID:QQN
ユニコーンガンダムバズーカ
3名無しさん@おーぷん :2015/09/30(水)19:55:54 ID:vrk
>>2
それじゃUGBじゃ・・・
4名無しさん@おーぷん :2015/10/01(木)02:38:50 ID:tUS
三行で
5名無しさん@おーぷん :2015/10/01(木)03:57:16 ID:Biu
UCBとはランダムな報酬を与えてくれるバンディットマシーンをいかに効率よく報酬獲得率を推定しながら、
報酬を高く得るかを考えるための手法

さいきんはこれの派生手法としてUCTなるものが出てきて、囲碁がかなり強くなった
6名無しさん@おーぷん :2015/10/01(木)03:59:16 ID:EUV
海外の論文だとGoって囲碁が表記されててちょっと笑う
7名無しさん@おーぷん :2015/10/01(木)04:02:50 ID:EUV
UCTアルゴリズム
http://minerva.cs.uec.ac.jp/~ito/entcog/contents/lecture/date/5-yoshizoe.pdf
http://www.logos.ic.i.u-tokyo.ac.jp/~miki/doc/gpw2009.pdf
http://www.computer-igo.com/category1/entry8.html
8名無しさん@おーぷん :2015/10/01(木)04:14:17 ID:AG8
他の探索手法と比べて何が違うのか3行
9名無しさん@おーぷん :2015/10/01(木)04:49:02 ID:Dhh
UCTは受け取れる平均報酬を最大化することを考えて行動する
理論的に平均報酬を最大化する工夫を入れてある
だから探索と報酬獲得のバランスがいい
10名無しさん@おーぷん :2015/10/01(木)16:51:39 ID:JQ7
ロボット応用はまだそんなにないよな?
11名無しさん@おーぷん :2015/10/02(金)00:41:06 ID:C4i
探索手法でドローン飛ばしてる研究はuctだった気がする
12名無しさん@おーぷん :2015/10/02(金)01:02:45 ID:Fff
将棋もuctなの?
13名無しさん@おーぷん :2015/10/02(金)01:51:23 ID:nZL
へーよくわからんけどすげーのかな?
14名無しさん@おーぷん :2015/10/04(日)14:02:47 ID:rly
強化学習と相性がいいとか

新着レスの表示 | ここまで読んだ

名前: mail:





俺の中でUCB探索手法がロボットに使えるのではないかと話題に