更多
- 国学
- 数码
- 家居
- 彩票
- 公益
- 酒业

凤凰网科技 > 产品

凤凰网科技 > 产品 > 正文

谷歌大脑提出TCN，能让机器人边看视频边模仿

2018年02月07日 13:16:00
来源：雷锋网

原标题：谷歌大脑提出TCN，能让机器人边看视频边模仿 ▷谷歌大脑Time-Contrastive N

原标题：谷歌大脑提出TCN，能让机器人边看视频边模仿

▷谷歌大脑Time-Contrastive Networks（TCN）论文解读视频

翻译 | Laura 校对 | 吴璇整理 | 凡江

雷锋网按：在「Time-Contrastive Networks: Self-Supervised Learning from Multi-View Observation」这篇论文中，谷歌的研究者提出了一种从观察中学习世界的新方法。雷锋网本期译制视频多角度展示了机器人仅仅通过观看视频，就能在无人监督的情况下，模拟视频动作的全过程。

除了视频演示之外，谷歌大脑并未对机器人系统提供监督学习。他们将这种方法运用于各种不同的任务，以此来训练真实和虚拟机器人。例如，倒水任务，放碟任务，和姿势模仿任务。

第一步

通过视频的分解镜头来学习，将时间作为监督信号，发现视频的不同属性。这组嵌入向量经由一组非结构化和未标记的视频训练，里面含有和任务相关的有效动作，也有一些随机行为，来体现真实世界中的各种可能状态。

模型使用triplet loss误差函数，基于同一帧的多视角观察数据来训练多视角下同时出现的帧，在嵌入空间中互相关联。当然也可以考虑一个时间对比模型，只根据单一视角来训练。这一次，有效帧在锚点的一定范围内随机选定，根据有效范围计算边际范围。无效范围是在边际范围外随机选定。模型和之前一样进行训练。

第二步

通过强化学习来学习规则。基于TCN嵌入，根据第三方的真人示范来构造奖励函数。机械臂起初尝试一些随机动作，然后学会反复进行这些动作，就可以产生最高奖励的控制步骤，最后达成重现视频任务的效果。

模型在仅仅经历了9次迭代后就成功收敛，大约相当于现实世界15分钟的训练。同样地，在移碟任务中，机器人最初尝试随机运动，然后学会成功拿起和移动一个盘子。

好文
钦佩
喜欢
泪奔
可爱
思考

昨晚的成都

昨晚的成都width="190"

网红“手工耿”的现实困境

昨晚的成都

昨晚的成都width="190"

49岁许晴穿这样的袜子还脱下当眼罩用

娱乐圈水有多深? 看完成龙这段话你就知道了

昨晚的成都

昨晚的成都width="190"

原配自杀住ICU，老公和小三拍婚纱照

昨晚的成都

昨晚的成都width="190"

火星出现巨大羽状白云，在地球上都能看

人死后的世界是什么样子，真有阴曹地府吗？

昨晚的成都

昨晚的成都width="190"

兰台•“小鲜肉”在中国为何这么红

揭秘战争狂魔希特勒死因，真相让人难以置信

昨晚的成都

昨晚的成都width="190"

史上唯一女神仙三大预言至今未破

网罗天下

热门游戏

凤凰网科技官方微信

凤凰网科技

视频

图片新闻

讲堂音乐彩铃视频

凤凰无线

凤凰新闻天天有料

凤凰科技

分享到: