科大讯飞朱家泉发表主题演讲:A.I.赋能 智慧新媒体
科技
科技 > 传媒 > 正文

科大讯飞朱家泉发表主题演讲:A.I.赋能 智慧新媒体

2020年10月20-21日,由流媒体网主办的第二十届浦江论道暨中国IPTV/OTT智能视听产业高峰论坛,在上海国际会议中心(东方滨江大酒店)举行。本届论道以“5G新视界——智屏·智变·智汇”为主题,吸引全行业的智屏创新代表,共同探讨与分享基于大屏延伸出的跨界融合、跨屏联动、跨省共赢之道。

在20日上午的主论坛上,科大讯飞股份有限公司运营商事业部副总裁朱家泉发表了主题为《A.I.赋能 智慧新媒体》的演讲。

以下为演讲全文:

各位论道的朋友们,大家上午好,很荣幸代表科大讯飞股份有限公司来参加这次浦江论道,与大家一起 分享人工智能在整个新媒体行业的应用和探索。

讯飞超脑

首先先做一下广告,对于整个新媒体行业来说科大讯飞股份有限公司是一个新人,这是我们第三次参加论道活动。科大讯飞股份有限公司成立于1999年,是人工智能产业的一个从业者,我们拥有语音语言国家实验室和认知智能国家重点实验室。

我简单介绍一下人工智能当前的一些核心进展以及目前在各个行业里的应用。人工智能最近是比较热的一个词,其实人工智能概念最初是在1956年美国达特茅斯会议上提出,但是人工智能的发展,提出以后并不是很顺利。整个人工智能的发展经历了三个浪潮,每个网络和算力的发展都会促进一次人工智能的发展。从1956年提出以后,进入第一次;2000年的时候到了第二次;2006年随着深度学习的发展,进入第三次。

科大讯飞提出了讯飞超脑的概念,能听能说能思考。

能听就是大家熟知的语音识别,我们在CHime Challenge2016-2020年连续三届获得国际语音识别大赛冠军,每次大赛都有复杂的识别场景。目前我们在传统的识别领域噪音环境识别达到97.5%。

会说就是像计算机一样模拟人说话,讯飞在2005年参加Blizzard Challenge语音合成大赛,有很多国内外的知名机构参加。讯飞从2005年参加,连续14年获得比赛的冠军,自然度和相似度已经创造历史新高,最新一次的测试水平达到中央电视台的播音人员的水平。

能理解就是阅读理解水平,我们参加斯坦福SQuAD机器阅读理解大赛,全球首次在全部两项指标上都超过了人类平均水平,一举创下比赛的全新纪录。讯飞在2019年使得整个机器学习的力度首次超过人类,达到89.47%。

会思考是我们认为在认知领域一个非常重要的难题。在国际上面,有一个国际认知的挑战大赛,Winograd Schema Challenge,在业界被认为取代图灵测试来判断国际推理的最重要的挑战。我们在2016年获得第一名,第一名的逻辑推理的能力只有58%。机器的推理还没有达到我们6岁儿童的水平,应该说,我们通用的人工智能才刚刚起步。

人工智能+

现在人工智能已经开始逐步渗透到各个领域,讯飞认为人工智能对我们的影响主要有两大块。第一个是通过自然语音的交互来改变我们的生活,第二个是人工智能通过智能学习来赋能我们的各个行业。

自然交互改变生活,其实人从机器获取信息经历了好几个发展阶段,从早期的电话阶段到PC+互联网阶段,再加上移动智能终端的移动互联网阶段,我们认为当前人工智能到来的时代,已经到了与语音交互为主,触摸交互为辅的第三代的人机交互的发展阶段。

一类是我们的弱视觉承接的设备,早期的智能语音,还有一类是强视觉呈现的语音交互,未来的语音发展基于强视觉呈现的语音交互是我们IoT的重点发展领域。我们90%信息的输出是通过语音,人想要表达自己的信息和思想,第一个想到是通用语音表达,但是人类获取信息的来源和输入80%来源于人类的视觉,人机交互的领域强视觉交互的领域是未来IoT的发展大趋势。

基于自然语言交互,讯飞积极拓展其他领域的智能终端,我们的讯飞翻译机目前已经支持58种语言与中文之间的互译,包括中国各个地方方言进行互翻,目前覆盖200多个地区,我们针对办公场景推出办公本和办公录音笔,方便我们存储和检索,还推出学习机等。

我们致力于把最好的自然语言交互技术提供给广大的中小开发者,让所有的开发者在语音平台开发属于自己的智能硬件的相应产品。我们可以看到尤其是近几年5G的到来和双千兆网络的开发,整个开发者有大幅度的增长,截至到2020年7月,我们覆盖的终端数超过29亿,每天通过讯飞的云平台调用的次数超过80亿次,开发者总量超过140万,这是我们A.I.领域应用的重要点。

其实,人工智能不仅仅是在硬件和IoT侧影响大家,已经开始在各个行业领域内来赋能。目前我们可以在教育、医疗、司法、金融等领域都有进展。简单说一下科大讯飞在这几个领域赋能的进展:首先是教育领域,科大讯飞为整个教育系统提供助教、教育超脑,智能学伴的功能,科大讯飞和国家考试中心成为教育超脑,利用大屏我们可以轻松掌握每个孩子的学习状况,使得我们从孔子时代提出的因材施教有了A.I.将变得可能。我们可以给每个孩子提供他们的个性化学习手册,针对孩子的学习薄弱点进行强化训练和学习。目前我们这一整套的因材施教和我们的A.I.教学系统覆盖31个省,为超过1亿的师生提供A.I.和教学服务。在这次疫情到来的时候,我们通过听课不听学,在将近20个省的孩子当中提供线上教学系统,和教学学习。

其次是A.I.+医疗,在医疗领域内A.I.可以帮助我们做什么?科大讯飞是全球第一个通过国家执业医师资格考试综合笔试测试的机器人,科大讯飞智医助理机器人考456分,超过96.3%的人类考生。我们可以做A.I.医生的助手,目前我们的智医助理在安徽省推广应用,覆盖了66个县区。智医助理2018年3月2日在合肥正式上岗,为全科医生提供辅助诊疗服务。累计提供辅诊服务超过7300万人次,平均每天提供1.1万次辅诊建议。5月,韩国到中国考察发现,我们的整个回访系统大幅度提升大面积人员回访的效率,并于5月份在韩国上线整个智能回访,这是A.I.在当前的应用。

最后是A.I.+司法,解决庭审的记录员以及刑事案件智能辅助办公系统,目前在上海等诸多中高法和检察院得到大量的应用。

A.I.如何赋能智慧新媒体

前面一部分是简单跟大家讲一下当前人工智能的进展以及我们在赋能行业领域的思考。下面重点跟大家分享一下近两年科大讯飞跟新媒体行业及视听行业做的A.I.如何赋能智慧新媒体。从当前来看,可以从三个方面来赋能整个新媒体行业,第一是老百姓的信息获取更便捷,第二个是整个媒体行业的从业者的内容生产更加智能,第三是媒体运营更高效。这些都可以用A.I.来给大家做一个非常好的全面赋能。

就像前面很多的嘉宾说的,随着5G的到来,我们认为进入信息大爆炸的时代,尤其是家庭的电视大屏作为我们家庭非常重要的一个屏幕信息输出来源,目前传统的电视交互限制家庭的信息交互边界,未来家庭电视的屏幕服务和信息一定是多样化的,包括教育、老百姓关心的日常以及现在流行的短视频等信息,都会呈现在电视大屏上面,但用户很难获取这些来源。

电视作为一个非常典型的原厂强视觉呈现的IoT的设备,语音和语言成为电视最直接的交互方式,使得老百姓获得自己想要的各种各样的信息和服务。刚才大家提到了,因为中国的电视服务还是分省和区域化,2017年开始,科大讯飞联合四大运营商帮助其建立自己的分审的交互平台,目前在31个省超过68个省级运营商的IPTV和OTT服务构建交互平台。截至目前,覆盖的用户总规模超过2.5亿,累计语音交互次数78.6亿次。另外,我们还发现老百姓有很多的需求,认为未来基于电视大屏的智慧发展有一个非常大的爆发,因此我们下午还有一个分论坛即智慧家庭的分论坛,我们有更深入的理解和思考。感兴趣的朋友们下午可以参加我们的分论坛。

除了让用户获取信息更便捷,同时我们想要提高大家的生产效率。媒体采访是我们新媒体涉及到的领域,传统的录音笔和手机的模式,大家使用过程当中非常有弊端,科大讯飞针对多种的智能采访场景做了很多类型的智能采访设备,从会议的点对点交流,从演讲,因为场景是不同的,科大讯飞在不同的场景之下,都做了对应的硬件产品。今天我正好带来一个,就是智能的录音笔,上面有两个非常强的麦克风阵列,让我们可以在十几米之外收到声音,并且非常清晰,同时也能把文字转化成多国的语言,实时通过这个屏幕展现出来,并通过后台的数据进行互联网的发送。一般情况下,我们通过智能录音笔的系统在演讲完之后得5-10分钟出一个完整的演讲稿,这是我们通过A.I.助力媒体者怎么样提高他们的采访效率。

另外,还有一个智能字幕,其实早期的电视台给讯飞提出要求,现在很多语言需要翻译,尤其是直播的场合下,我们的智能字幕助力媒体生产者可以快速提高文字的记录,多语言的翻译,包括自动对码对齐,这些已经在我们实际应用当中得到应用,包括会议系统,包括每次苹果发布会之类的这种国外的发布会,都会使用我们的智能字幕系统,可以快速提高我们的生产效率。

另外,还有一个应用比较广,是大家看到的虚拟主播,使得我们可视化的新闻内容生产快速实现。我们有一个虚拟主播的系统,可以提供给很多新媒体,你们只要通过图片输入文字,选择你们想要的模板,可以在短时间内生成对应的虚拟主播播报。在早年间我们想要用A.I.模拟一个人的声音,需要人录很多的样板,举一个例子,我们早期跟高德录女明星的声音,我们录了一周多,每天需要女明星录半个小时的语料,最终形成高德导航的声音库,现在的技术只需要你读一句话,,A.I.可以快速学习声音,你想要学习得维妙维肖,就多读几句话,类似的技术得到广泛的实践,使得我们的生产效率快速提升。

还有一个领域是电视屏幕,作为党的媒体,安全播出是非常重要和关键的,讯飞提供智能媒资监审系统,包括涉黄涉恐、研判监管、节目检索功能,提高工作效率。目前已经监控25个频道,每天监控的数据有150个对应的节目,大幅度提升监控的效率。还助力媒资编幕智能化,现在我们自媒体的公司有很多传统的媒体无法数字化,早期的录像带、磁带上面的音视频数据我们怎么在现有的情况下转化为数字化数据,使得他它可以编排,可以检索,可以实时应用?我们通过智能媒资的管理系统完全可以实现,通过全库的语音识别实现智能化、自动化,口播我们也可以从十几个小时的音频和视频当中快速检索出来,大幅度提升我们整个媒资编排的效率。

此外,我们认为当前IPTV和OTT领域,电视广告相对于我们的互联网和移动互联网还有大幅度可以提升和挖掘的空间,我们的A.I.能力可以通过视频图像语音技术实时甄别用户正在看的影视内容。目前的内容在芒果TV和浙江卫视和广东广电进行尝试,使得我们广告的效率和广告数据的挖掘有大幅度的提升。

讯飞认为人工智能未来会像水和电一样存在,我们相信未来每个领域,每个行业乃至每个企业都会有自己的人工智能平台,利用人工智能来开发不同的产品和服务,讯飞愿意把我们的最新技术能力和服务赋能给大家,我们一起去探索整个人工智能的大市场,用A.I.赋能我们的智慧新媒体,未来无限可能。

亲爱的凤凰网用户:

您当前使用的浏览器版本过低,导致网站不能正常访问,建议升级浏览器

第三方浏览器推荐:

谷歌(Chrome)浏览器 下载

360安全浏览器 下载