注册

对话科大讯飞胡郁:新增超100项AI能力,AI助手打电话早于谷歌


来源:智东西

智东西 文 | 寓扬

智东西5月17日消息,今天,科大讯飞在深圳发布4款新品:AIUI语音交互平台3.0、魔飞麦克风2.0、AIoT物联网平台、iFLY OS物联网操作系统。

AIUI语音开放平台本次3.0升级新增了文字识别、医疗听写等能力,将在今年年底提供超过200项能力,新增AI能力超100项。魔飞麦克风新增分布式、能量跟随和声纹唤醒的新功能。而AIoT和iFLY OS则是科大讯飞面向物联网领域首次发布的新品。

讯飞还亮出了新的成绩单,开放平台开发者数量已经达到80万,每天移动端使用语音次数达45亿次,电视每日语音交互次数超过2600万,智能音箱日交互次数达4000万等。此外,讯飞还整合语音识别、语音唤醒、语义理解、语音合成技术,将系统级解决方案免费开放。

null


(左为科大讯飞执行总裁、消费者BG总裁胡郁;右为消费者BG执行总裁于继栋)

会后,科大讯飞执行总裁、消费者BG总裁胡郁、消费者BG执行总裁于继栋接受了智东西等媒体的采访,他们告诉智东西通过魔飞麦克风开发者可以将过去半年的开发在几个小时内实现,并且通过AIoT和iFLY OS操作系统,帮助开发者打通产品开发的各个环节。

一、发布四款新品

在发布新品前,科大讯飞先简单干脆的秀了一下肌肉,展示近期取得的一些成果。消费者BG执行总裁于继栋分享到,2017年讯飞开放平台开发者的数量达到51.2万,而2018年如今已经达到80万,其中开发者主要集中在教育、通讯、机器人及智能硬件领域,其中教育类开发者占到20%。

null


下面又是一串科大讯飞语音交互在不同设备的日活成绩单:每天移动端使用讯飞语音次数达45亿次,电视每日语音交互次数超过2600万,智能音箱日交互次数达4000万,车载日交互次数达2000万次,商用机器人日交互次数超300万次。相比2017年,2018年讯飞在学习、社交、智能硬件、商务办公、生活服务等领域实现了超100%的增长。

秀完肌肉后,科大讯飞发布了4款产品:AIUI语音交互平台3.0、魔飞麦克风2.0、AIoT物联网平台、iFLY OS物联网操作系统。

1、AIUI语音交互平台3.0

null


其中,AIUI语音交互平台升级到3.0,新增了文字识别和医疗听写能力。在文字识别方面,讯飞的手写识别准确率达97%,印刷文字识别准确率97%,数学公式识别达93%等。

胡郁后来也补充到,AIUI平台将在今年年底提供超过200项能力,新增AI能力超100项。为了让开发者更好的使用AI能力,科大讯飞还与商汤科技、码隆科技、小牛翻译等AI技术公司合作,进行技术的组合和封装。

2、魔飞麦克风2.0

null


去年科大讯飞发布了魔飞麦克风,开发者可以在其基础上进行开发, 也可以通过它与家电设备相连来实现智能化。今天魔飞麦克风升级为2.0,对回声消除、功耗等进行了优化,还添加了分布式、能量跟随、声纹唤醒等新功能。

所谓的分布式功能,就是在一个局域网内放置多个魔飞麦克风,在与用户的交互过程中,距离用户最近的魔飞会被唤醒,这一点雷军也在小米mini音箱中介绍过。

能量跟随则与波束形成技术有关,之前当你唤醒智能音箱时,麦克风阵列会对一个方向形成波束,从而更好的获取某个方向的声音。魔飞麦克风升级后,这个波束形成可以跟随用户发出声音的位置进行动态的调节,就像能量跟随一样。

而声纹唤醒也是此次魔飞麦克风新增的一个功能,让设备可以闻声识人,科大讯飞也会把相关接口开放给开发者。

3、AIoT物联网平台、iFLY OS物联网操作系统

null


于继栋称,过去18个月使用讯飞AI能力的终端数已经达到了近20亿的数量,值得注意的是过去两年时间,非手机类智能终端的比例已经从1%提升到7.6%,这是一个非常可观的量。以智能家居、智能穿戴设备、机器人、安防监控等为代表的物联网设备近期呈现井喷之态,科大讯飞也对物联网领域开始重视,并推出AIoT物联网平台。

AIoT分为两部分,一部分是云端,讯飞提供开放的语音交互平台,聚合的内容、广告生态,以及AI的能力;在终端提供本地计算等。

至于iFLY OS物联网操作系统会如何布局,会后智东西也把这个问题抛给了胡郁,他解释到,这是出于更好的打通开发者在产品开发过程中各个环节面临的障碍,通过OS物联网系统,将设备需要的各种底层系统打透,能够让开发者更自由的开发。他也称这是第一次发布OS系统,后期会公布更多细节。

二、魔飞2.0、AIUI3.0、AIoT落地语音交互场景

为了更好的理解魔飞2.0、AIUI3.0、AIoT三者之间的关系,科大讯飞产品经理也以掌勺科技运用AIUI3.0和AIoT推出的魔橱为例进行示范,魔橱看上去像厨房中的一块平板,将魔飞麦克风与平板相结合,接入讯飞AIoT后,魔橱就具有了远场语音交互的能力,它可以连接不同的设备,并调用。此外,魔橱还加入了手势识别,人脸进行交互,满足厨房场景的交互。

null


于继东还提到,讯飞将WiFi协议与语音打通,通过一个麦克风模块,就可以对现有WiFi类设备进行改造,实现语音交互,让所有WiFi设备都用上AIUI平台。

此外,AIUI今天的一项重要更新在于开发者开发速度的提升。于继东告诉智东西,过去开发者需要花半年来整合讯飞的能力,而现在可以基于魔飞麦克风进行开发,魔飞就就相当于一个开源硬件,开发组件的一部分,有了魔飞麦克风就相当于把硬件开发变成了软件开发,使开发者真的可以在几个小时做出一个Demo应用来。

三、基于视觉的语音交互是未来发展方向

新品发布后,胡郁围绕未来的发展态势主要谈了三方面内容:

null


首先,他回应了外界对科大讯飞盈利能力不行的质疑,他称讯飞每年要投入数以亿计的资源到开发者平台,赤字来自开放平台。

第二, 他认为基于视觉呈现的语音交互是未来的发展方向,人类获取信息80%依赖眼睛,但人类90%的信息输出依靠语言,并且移动场景、车载场景、家庭场景都是自然语言交互的重要场景。

前几天在谷歌I/O大会上,谷歌发布了AI助手打电话功能,他称讯飞几年前就实现了,并在各大运营商的客服中使用。

第三,系统创新+产品创新。胡郁公布了2017年技术投入增长超61%,技术研发团队增长56%,讯飞擅长的是源头核心技术的创新,并不断扩展平台能力,降低创新门槛,由开发者来做产品创新和应用创新。

结语:重点在于加快行业落地

通过今天科大讯飞AIUI的3.0升级我们可以看到,一方面在百度等语音技术公司的竞争下,科大讯飞也在加快技术整合与开放,今年开放的能力将达到200项。

另一方面,科大讯飞通过整合AIUI、魔飞麦克风、AIoT、iFLY OS系统,更加注重对物联网终端的重视,以及通过关键技术以及系统的整合,降低开发者门槛,加快行业落地。

  • 好文
  • 钦佩
  • 喜欢
  • 泪奔
  • 可爱
  • 思考

频道推荐

凤凰网公益基金救助直达

凤凰网科技官方微信

凤凰新闻 天天有料
分享到: