注册

思必驰CEO:语音是人工智能核心入口 将变革整个行业


来源:凤凰科技

高始兴认为,从PC到手机,到现在的智能硬件,几个趋势,我们发现屏越来越小,现在没有屏幕了,现在更多的是场景化、碎片化和随时使用,语音是越来越刚性的。

思必驰CEO高始兴

凤凰科技讯 8月18日消息,今天上午,iWorld 2016数字世界高峰论坛在成都新国际会展中心召开。思必驰CEO高始兴在演讲时表示,语音识别做的好不代表语音交互能做好,所以必须加上AI。

高始兴指出,人工智能最大的发展就是从局部到整体的智能,到整体形成落地,再就是会结合场景服务越来越多。但是从局部走向整体挑战特别特别大,就像前段时间阿尔法狗战胜李世石,单纯下棋人工智能做得不错,但是如果做成下棋机器人,让它能够准确识子落子,作为综合系统挑战特别大,这也就是现在很多智能机器人很难落地的关键原因之一。

高始兴认为,从PC到手机,到现在的智能硬件,几个趋势,我们发现屏越来越小,现在没有屏幕了,现在更多的是场景化、碎片化和随时使用,语音是越来越刚性的。

“语音是核心入口,但是局部的智能、简单的智能、单一的智能必须加上认知、加上脑袋,让这个智能终端能够不单是去识别,而是能去说话,而且能思考、能分析,能结合场景做推理决策等等这些,这样才能真正成为用户个人的助理、秘书、管家。”

高始兴提出,相信语音人工智能的发展和云计算、大数据未来会让整个物联网行业甚至移动互联网能发生一些变化,乃至一些变革。

以下是高始兴的演讲实录:

我就互联网下的人机对话做一个简单的分享。

我们最早在英国成立的时候,公司起来名字叫AISPEECH,这几年很多人讨论语音,讨论语音的性能,在选型的时候,包括讨论语音公司的时候,更多是说语音识别,这家的识别率怎么样,准确率怎么样,但实际上再好的识别率也达不到100%,即使98%也很难做好很好的语音交互,语音识别做好不代表语音交互能做好,所以必须加上AI。

放大到AI来看,这几年新的能力,云计算的能力,大数据的累计,让人工数据发展特别快,最近流行一句话洪荒之力,确实产生了洪荒之力,人工智能落地速度会非常快,但是反过来也会形成一个循环。

早期我们谈论人工智能,PC时代说的是存储和计算,但是到移动互联网,特别是智能硬件物联网时代,大家谈感知和表达一进一出,能力越来越强,特别现在智能硬件感知能力越来越多,现在人身上的耳朵、嘴巴,包括未来的鼻子等等一些感知能力未来都会在智能硬件上落地。

但是就像人一样,单纯的耳朵嘴巴还不行,必须要加上大脑,能够去理解、思考,反馈建议,这样才能够让人机交互更加聪明。特别是智能硬件物联网时代,现在是认知职能,加上脑袋现在是一个大的研究方向,我们在做,很多公司也在做。

人工智能最大的发展就是从局部到整体的智能,到整体形成落地,再就是会结合场景服务越来越多。但是从局部走向整体挑战特别特别大,就像我们在以前大家都知道升蓝战胜卡萨帕罗夫,前段时间阿尔法狗战胜李世石,单纯下棋人工智能做得不错,但是如果做成下棋机器人,让它能够准确识子落子,作为综合系统挑战特别大,这也就是现在很多智能机器人很难落地的关键原因之一,要做综合的智能挑战特别大。

我们做人机对话,让人获取和享受到机器后端的服务,关键的是用户行为和需求发生了变化。早期的时候我们是组织图标、文件,再后来是浏览资讯交互,再PC互联网时代是更加精准的搜索信息,搜索一些内容,到移动互联网时代,智能硬件IOT时代它的交互更加丰富化,手段更加多样化。

更关键的是用户的任务属性越来越强,它不是信息查询的,特别我们看现在落地的车联网、家居等等,它是希望完成任务,这个属性越来越强,当然各类人机交互能力也出现了,不单是像做语音交互的,包括人脸,包括首饰等等一系列的。

从阿尔法发展的历史来看也能看到语音智能的发展历史,语音智能跟端的结合,跟场景的结合,它的未来的趋势。在早期Iphone2代里边没有语音,但是75%的用户希望加上语音,下一代加上了,但实际仅仅实现简单的控制功能,拨号,后来发现不到5%的用户用它,不好用。苹果调研,大多数的用户希望通过自然语言的交互,不是完成一个简单的控制功能,而是更丰富的场景,所以4代Siri发布了,引爆了这个市场。

早期的是不够智能的,相对说是局部智能,这两年苹果Siri的发展代表了人机交互的趋势,包括应用趋势,与端结合的趋势。去年苹果收购了剑桥一家人机对话的公司,Siri前段时间发布融合了一些技术。再一个趋势就是会发现,苹果Siri在与端服务整合上越来越紧密,特别智能引见这个领域,现在不光是苹果这个巨头,还有一些希望跟车合作,包括谷歌,未来的人机对话、人机智能语音交互跟智能硬件IOT的整合是未来大的趋势。

从PC到手机,到现在的智能硬件,几个趋势,我们发现屏越来越下,现在没有屏幕了,现在更多的是场景化、碎片化和随时使用,语音是越来越刚性的。

还有一个,我们现在IOT这个生态起来,每一个生态,包括移动互联网生态,需要垂直的整个服务生态起来,能够去获取服务。我们在手机端,智能手机段,我们人可以通过智能手机去订票、订餐,但是未来通过机器人、车载音响,我们怎么订票订餐呢?语音有可能是唯一或者主要的交互手段,因为语音唯一能够传递复杂信息。

所以语音是核心入口,但是局部的智能,简单的智能,单一的智能。比如简单的语音识别、语音合成,耳朵嘴巴不好使,感知智能,必须加上认知,加上脑袋,让这个智能终端能够不单是去识别,能去说话,而且能思考、能分析,能结合场景做推理决策等等这些,这样才能真正成为用户个人的助理、秘书、管家。

从思必驰来说主要面向三个垂直领域,车载、家居、机器人,提供两个产品,一软一硬。一个是人机对话的操作系统,基于现在主流操作系统的后操作系统,整合了语音交互、对话逻辑、内容服务、平台对接。再就是智能芯片模组,我们提供给开发者,让每一款智能设备能听会说,能帮用户的忙,真正让智能机器成为一个智能机器人。

在智能硬件有一些技术能力要做提升和创新,比如说噪声抗噪识别,因为在车载家居交互特别大,再就是远距识别。还有一个是回声对消。还有手机定位,在机器人、音响,很多交互,用户是360度随时随地可以跟智能终端交互。

智能硬件、物联网、语音是核心交互手段的时候,要赋予智能终端温度,所以看起名字,每个设备可以起名字,叫它一声可以听你。还有就是个性化合成,我们思必驰做了很多名人的声音。明年每个用户上传几分钟声音,未来交互就可以是这个声音,比如把女朋友或者爱人的声音上传上去,这个模型,未来开车的时候语音交互是你老婆或者女朋友的声音。

思必驰专注在IOT智能硬件的三个垂直场景,现在做的基础不错,发展速度也还好,我们在车载后装是NO1,在机器人也做得很不错,比如跟小米、美的等等合作。现在全国各类智能终端人际访问量几千万次,说明智能硬件发展越来越火爆,加速度越来越快,还有就是语音交互,甚至在一些中心探测设备上能成为入口。

相信语音人工智能的发展和云计算、大数据未来会让整个物联网行业甚至移动互联网能发生一些变化,乃至一些变革,我觉得有六个方面。

一是产品创新,像功能机变成智能手机。二是场景生态,端跟场景和服务的结合越来越紧密,在一个场景里面形成闭环生态。

移动互联网到智能硬件物联网,语音数据、视频数据累计会越来越多,有一些新的数据挖掘方式,而且智能终端感知能力会越来越强,结合场景会越来越紧密,对用户的画像分析纬度,颗粒度会越来越细,越来越丰富。

再就是端、场景和行业结合会越来越多,会产生很多的机会。比如说未来的车里面,跟机器人,面向电视、音响我们可以学口语,再就是移动互联网向智能硬件物联网产业,不能完全迁移,一定会发生一些变化,甚至变革。

比如说搜索不单是人机交互这个界面发生了变化,有可能新的商业模式。随着语音职能的发展,用户的认知和普及,人机对话,自然语言交互会反过来切入移动端,会打破原来的信息孤岛。

最后手机也会成为泛物联网IOT的一个端而已。相信语音的发展,人工智能的发展,会带来很多的商业机会和创业机会。

谢谢大家!

[责任编辑:王圣威 PT010]

责任编辑:王圣威 PT010

  • 笑抽
  • 泪奔
  • 惊呆
  • 无聊
  • 气炸

频道推荐

凤凰网公益基金救助直达

凤凰科技官方微信

凤凰新闻 天天有料
分享到: