分享主题
鲁棒强化学习
分享背景
强化学习算法依赖大量采样的特性决定了需要首先在仿真环境中训练智能体策略再迁移到现实系统中。因此当仿真环境和现实系统出现不匹配时,策略的鲁棒性是影响强化学习算法能否实用的关键因素。本次公开课中,讲者将介绍华为伦敦研究所决策与推理团队在鲁棒强化学习方面的相关工作。
分享嘉宾
任航,伦敦帝国理工学院博士,任职于华为诺亚方舟实验室伦敦
分享提纲
华为伦敦研究所决策与推理团队介绍
强化学习的相关背景知识与强化学习的鲁棒性问题
Wasserstein Robust Reinforcement Learning 论文解读
分享时间
(北京时间 ) 10月 10 日(星期四) 20:00
“特别声明:以上作品内容(包括在内的视频、图片或音频)为凤凰网旗下自媒体平台“大风号”用户上传并发布,本平台仅提供信息存储空间服务。
Notice: The content above (including the videos, pictures and audios if any) is uploaded and posted by the user of Dafeng Hao, which is a social media platform and merely provides information storage space services.”