媲美联合国同传 百度听清在2018百度世界大会的挑战
科技
科技 > 手机 > 正文

媲美联合国同传 百度听清在2018百度世界大会的挑战

原标题:媲美联合国同传 百度听清在2018百度世界大会的挑战

PConline资讯】11月1日,2018百度世界大会盛大开幕。一款可媲美联合国会议同传口译人员的产品“百度听清”引爆全场。

百度创始人、董事长兼首席执行官李彦宏演讲时,百度听清在现场两侧的大屏幕上为现场观众带来实时、精准的中英文双语“字幕”直播。这也是百度听清第二次承担起百度世界大会中英文“直播”工作,从现场可以看到,即使语速较快或混杂着英文、专业名词,它也能准确识别并翻译出来,伴随演讲者的演讲节奏实时上屏,智能且精准,丝毫不逊色于专业同传人员。

据介绍,百度听清搭载了百度全新推出的即时机器翻译系统。该系统已红遍海内外AI领域,外媒IEEE Spectrum表示,它可以与联合国会议期间提供同传服务的口译人员相媲美。

实时翻译看起来很简单,实际背后的技术相当复杂,需要迈过多道坎儿。内容上屏前需要完成两个步骤:首先利用语音识别技术识别演讲者内容,将语音转换成文字,之后调用机器翻译引擎将文字翻译成目标语言。而像百度世界大会这种超大规模的会议,演讲内容专业、口语化、经常出现中英文混合的情况,给机器准确识别语音带来巨大挑战。

基于在语音和自然语言处理领域的多年积累,百度听清依托于百度Deep Peak 2中英文混合语音识别建模技术、百度“语音容错”的对抗训练机器翻译模型,语音识别和翻译能力业界领先,为观众带来了一次无与伦比的实时字幕体验。

在语音识别方面,百度语音识别技术采用基于Deep Peak 2的中英文混合建模方案。区别于传统的上下文相关建模技术,这一方案采用上下文无关音素组合的中英文混合建模单元,具有数量少、泛化性能好、对噪声鲁棒等特点。会中,“百度AI”、“百度Apollo”等中英文词句经常常见,中英文混合建模可以更准确地识别这些词句。

在翻译方面,百度研发的具备预测能力和可控延迟的即时机器翻译系统,可实现两种语言之间的高质量、低延迟翻译。值得一提的是,百度“语音容错”的对抗训练翻译模型,根据语音识别模型常犯的错误,在训练数据中有针对性地加入噪声数据,使得模型在接受到错误的语音识别结果时,也能够在译文中纠正过来。目前,百度已经可以支持全球28种语言、756个方向的相互翻译,尤其在汉语同其它语种的互译上打磨得尤为深入。

如今,百度听清在大会演讲同传、企业会议记录、会议直播字幕等细分场景具备了成熟的解决方案,广泛应用于科技、汽车、互联网、政务、教育等领域。同时,百度听清涵盖了基于端到端远场语音方案的前端拾音终端、灵活部署的解码服务端、可视化管理系统等完整的软硬一体化的解决方案,可以针对企业的需求针对性地提供服务。

随着国际化会议日益增多,市场对同传人员的需求量也急剧增加。虽然机器暂时还无法比肩高级同传人才,但相较而言,机器翻译不需要休息,并可同时掌握几十种语言的翻译能力,擅长多个领域的翻译,这是人工同传不具备的优势。实际上,AI同传的目的并不是取代人类译员,而是降低成本,扩展其应用范围,利用AI早日实现全世界人类无障碍交流。

科幻电影《银河系漫游指南》中,巴别鱼寄生在主人耳朵里,让寄主就能听懂任何一种人类语言。从大会现场可以强烈感受到,正如本届世界大会的主题——“Yes, AI Do”所表现出的美好愿景,百度正清晰、脚踏实地让AI落地到现实生活中,人们离“巴别鱼”又近了一步。

亲爱的凤凰网用户:

您当前使用的浏览器版本过低,导致网站不能正常访问,建议升级浏览器

第三方浏览器推荐:

谷歌(Chrome)浏览器 下载

360安全浏览器 下载