谷歌将Gemini引入Google Home!智能音箱“换脑”,摄像头自动生成字幕
科技
科技 > 数码 > 正文

谷歌将Gemini引入Google Home!智能音箱“换脑”,摄像头自动生成字幕

编译 | 黄心如

编辑 | 李水青

智东西8月9日消息,谷歌于8月6日宣布,将推出基于Gemini AI的Google Home功能。随着Google Home获得强大的AI支持,Nest智能音箱和显示器上的Google Assistant将于2024年晚些时候进行重大升级Nest摄像头也将在不久后具备识别和显示功能。

尽管聊天机器人往往更能引起关注,但生成式AI的确有潜力使智能家居变得更加直观和用户友好。亚马逊今年六月已公布了增强版Alexa的计划,而谷歌也在加紧步伐,承诺推出更智能、更强大的Google Assistant。

一、 Google Home引入Gemini,智能摄像头等新功能即将上线

在下周(8月13日)秋季硬件产品发布会之前,谷歌宣布了三项新的Gemini智能体验,这些功能将于今年晚些时候登陆Google Home平台。其中包括:

一项新的摄像头智能功能,它可以为Nest摄像头的视频片段自动生成描述性字幕;

一项自然语言输入功能,用于在Google Home里创建程序;

一个更智能的Google Assistant,它将适用于Nest智能音箱和显示器,并且配备新的语音选项。

除了新语音选项之外,大多数这些功能都将通过Google的Nest Aware订阅付费提供——Nest摄像头的视频录制订阅起价为每月8美元(每年80美元)。这些功能将首先在Google的公共预览测试版计划中限量向Nest Aware订阅者推出,并将于明年扩展至更多用户。

在发布会前,Google Home产品负责人Anish Kattukaran接受The Verge采访时提到,这只是谷歌智能家居平台迈向智能化新时代的开始,“这为Google Home的下一个时代铺平了道路”。

迪士尼是怎么做双足机器人的?

▲以上是一个Matter控制器和Thread边界路由器组成的新智能家居中心(图源:Google Home)

二、Gemin提升用户体验,但不取代Google Assistant

这一更新对于长期受挫的Google Home用户来说是个好消息,许多用户已经厌倦了性能不足、设备老化的智能显示器,以及常用的功能被取消的困扰。此外,他们还经历了从Nest应用到Google Home应用的艰难过渡。本周推出的Google TV Streamer 4K(Google Home中心)和新的Nest Learning Thermostat,加上更智能的Google Assistant,预示着Google的智能家居生态系统正在改善。

Google Assistant显然将继续存在。Google并未将Gemini直接移植到Nest智能音箱和显示器上来控制智能家居,而是在幕后部署了Gemini智能。Kattukaran解释道:“Gemini是一个模型系列,我们正在针对Google Home的各项功能对其进行优化”。

三、三大新功能实操展示,智能家居多方面发展

智能家居的发展不仅仅是技术功能的提升,同时也要注重在增强功能的同时保护用户的隐私和安全。下文将展示智能摄像头的新功能、家庭自动化的简化操作以及Google Assistant的升级和新声音技术。

1、自动生成字幕的摄像头安全警报

迪士尼是怎么做双足机器人的?

▲多模式Gemini AI可以理解摄像机捕捉到的画面和声音并生成描述动作的字幕(图源:Google Nest)

Google正在为Nest摄像头引入Gemini智能,使其能够理解摄像头捕捉到的画面和声音,并向用户传递关键信息。这意味着,Google Home之后将不仅仅发送有关某个人或包裹的警报,用户必须观看视频才能了解发生了什么,而直接添加摄像头所见内容的详细描述。这些模型将在云端专为用户的家庭数据进行学习和训练,随着时间推移,它们将变得越来越智能,更准确地了解用户家庭周围的动态。

Kattukaran分享的一个例子是一段人从车上卸下杂货的视频,标题为:

停放在车库里的一辆黑色SUV旁边站着一个穿着休闲服装的年轻人,他提着购物袋,周围环境显得十分平静。

除了提供解释性细节外,视频标题还包含丰富的背景信息。这样不仅有助于用户查找录像,还可以帮助系统链接到其他自动化功能。例如,如果摄像头识别到动物并判断是“狗在花园里挖洞”,系统可能会自动执行“打开洒水器”的操作。

迪士尼是怎么做双足机器人的?

▲用户将能够使用文本提示在Nest摄像机视频片段中搜索特定事件(图源:Google Home)

Google Home的活动标签中将新增文本搜索视频的功能。例如,当用户的猫在天黑后偷偷溜出家时,这一功能将非常方便。用户可以直接搜索上次发现猫的时间,而无需逐个浏览所有标有动物的视频来寻找。

2、可解析自然语言的自动化程序

迪士尼是怎么做双足机器人的?

▲Gemini智能可以解析自然语言来创建复杂的智能家居自动化(图源:Google Home)

Google Home应用程序新增的“帮我创建”功能允许用户描述希望发生的事情,例如“睡觉时锁门并关灯”,系统会自动创建一个对应的执行程序。

用户需要通过手机上的Home应用程序进行文本或语音输入(目前此功能尚不支持通过Nest智能音箱操作),但Kattukaran指出,它将具备Google Home应用程序的所有现有功能。这包括所有当前的启动器、条件和操作,以及对连接到Google Home的所有设备的访问,包括支持Matter标准的设备。尽管这项功能不像谷歌的脚本编辑器那样精密,但它足够简单,能够让任何用户轻松创建自动化功能。

3、新增声线及自然交互的Google Assistant

Google正在为其Google Assistant推出新的声音选项。除了摄像头智能和更简便的自然语言输入之外,谷歌还提到将改进其Google Assistant的“核心体验”——例如在所有当前的Nest智能音箱和显示器上播放音乐和设置计时器。

此外,Google Assistant将新增不同风格、语调和口音的声音选项。该公司发布了首个新声音选项的演示视频,这其中保留了女性的语调,但听起来更轻盈、更自然。

Google Assistant不仅听起来更自然,也能进行更自然的互动。Kattukaran说,它不需要特定的命令模式即可完成用户的需求,也能够处理停顿、“嗯”和“啊”,并回答后续问题。这与去年秋季亚马逊宣布的Alexa功能(尚未推出)类似。

Kattukaran提到,新的Google Assistant将能够保留用户的对话背景,并逐渐学习和了解用户的家庭情况。他透露,由Gemini驱动的功能将依据谷歌的隐私原则,在云端为用户的家庭提供服务。

“这个功能是根据用户家庭和数据模型量身定制的。我们在家用领域特意放慢了节奏,因为智能家居领域的容错率非常小,我们不希望出差池。”他提到。而Google Assistant的目标是逐步了解用户的家庭情况,比如用户拥有的房间和设备,并在此基础上变得更加智能化。

结语:Gemini助力Google Home升级,谷歌看好智能助手未来

这些变化旨在推动数字语音助手更接近谷歌及其竞争对手多年来一直努力实现的愿景:一个真正有用的数字助手。

“当我们开始推出第一代助手时,我们承诺它会是像《杰森一家》里那样的家具智能助手,我们的愿景是打造一个超级有用的助手,可以主动帮助你解决问题,” Kattukaran说,“我们取得了很多进展,但之后就停滞不前了——不仅是我们,所有‘助手’都如此。我们遇到了技术瓶颈,不过随着大型语言模型和多模态语言模型的出现,这一瓶颈已经得到解决。”

正如Kattukaran指出的那样:“家庭是一个庞然大物”,它复杂而混乱,有多个角色和场景。对于人类来说,管理它已经不易,对计算机而言更是巨大的挑战。但亚马逊、谷歌和苹果似乎都在竞相打造一个未来,让我们的家庭拥有一个智能的、可感知情感的助手,从而回应我们的需求。

未来的进展如何,值得期待。

亲爱的凤凰网用户:

您当前使用的浏览器版本过低,导致网站不能正常访问,建议升级浏览器

第三方浏览器推荐:

谷歌(Chrome)浏览器 下载

360安全浏览器 下载