大讲堂 | 强化学习的鲁棒性问题
科技
科技 > 数码 > 正文

大讲堂 | 强化学习的鲁棒性问题

分享主题

鲁棒强化学习

分享背景

强化学习算法依赖大量采样的特性决定了需要首先在仿真环境中训练智能体策略再迁移到现实系统中。因此当仿真环境和现实系统出现不匹配时,策略的鲁棒性是影响强化学习算法能否实用的关键因素。本次公开课中,讲者将介绍华为伦敦研究所决策与推理团队在鲁棒强化学习方面的相关工作。

分享嘉宾

任航,伦敦帝国理工学院博士,任职于华为诺亚方舟实验室伦敦

分享提纲

  • 华为伦敦研究所决策与推理团队介绍

  • 强化学习的相关背景知识与强化学习的鲁棒性问题

  • Wasserstein Robust Reinforcement Learning 论文解读

分享时间

(北京时间 ) 10月 10 日(星期四) 20:00

亲爱的凤凰网用户:

您当前使用的浏览器版本过低,导致网站不能正常访问,建议升级浏览器

第三方浏览器推荐:

谷歌(Chrome)浏览器 下载

360安全浏览器 下载