谷歌、亚马逊、苹果三大语音助手发展现状 谁被甩在身后了?
有趣的数码

本文由腾讯数码独家发布
无论是亚马逊Alexa、谷歌Assistant还是苹果Siri,都已经不是几年前刚刚推出时那般“青涩”的模样。三家科技巨头会定位对自己的人工智能语音助手进行更新和完善,并且彼此之间区别越来越大。而正是这种区别,让我们这些关注人工智能助手的人,对这种竞争持续充满了兴趣。
谷歌I\/O大会,是这家搜索巨头每年5月都会举办的开发者大会,并且出现了很多关于智能家居的新闻。而苹果的WWDC年度开发者大会也也刚刚开始。至于亚马逊的RE:MARS会议目前也正在进行中。这使得智能家居和语音助手领域最近的新闻让人应接不暇,尤其是与Alexa、谷歌Assistant和苹果Siri相关的新产品发布。
那么不妨让我们来探索一下最近三大语音助手的变化,以便更好地的了解每位助手的优势,以及他们各自最需要对哪方面进行完善,当然还有我们希望在未来看到哪些变化。
Alexa
自从2014年推出首款Echo智能音箱以来,亚马逊一直是智能家居领域的领导者。现在亚马逊旗下共有7款智能音箱和智能显示屏可供选择,并且都内置了由亚马逊的人工智能助手Alexa。用户需要说出“Alexa”来唤醒自己的语音助手,然后Alexa就可以帮助我们导航、指路、点菜,甚至开灯或调节恒温器的温度。
Alexa目前已经是一位功能相当强大的语音助手,但是它每次都需要唤醒词才能发起一场新的对话。例如,如果我问:“Alexa,走廊恒温器的当前温度是多少?”之后,又要求Alexa把走廊恒温器温度进行调整之前,我必须再说一遍“Alexa”。
当然,其实换成另外一说说法会更自然,也就是:“Alexa,走廊恒温器的当前温度是多少?”然后简单地说“将我的走廊恒温器设置为24度”,这样的说法更自然,而且不需要再次使用唤醒词。
幸运的是,亚马逊最近更新了两项新功能,可以让Alexa的自然语言能力更加智能。
首先,Alexa变得可以迅速处理多个相关的请求,而无需我们重复说出“Alexa”。我们预计该功能将于2019年晚些时候向美国用户推出,但是具体的计划目前还不得而知。我的同事本·福克斯·鲁宾(Ben Fox Rubin)在亚马逊re:MARS大会上已经看到了这一功能。在视频演示中,有人向Alexa询问当地电影院的电影播放时间、购买电影票、餐厅预订以及预订了一辆Uber汽车,过程中无需多次提到Alexa。
另外,亚马逊还举办了一场名为Alexa Prize Socialbot Grand Challenge的竞赛,鼓励大学生们设计社交机器人,并且帮助开发Alexa的自然语言能力。目前这项比赛已经进入到了第三个年头,加州大学戴维斯分校去年获得了第一名,其中包括一张50万美元的支票奖励,可以用来支持他们的社交机器人项目。亚马逊之前在一篇宣布2018年获奖者的博客中表示,这位机器人的平均通话时长为9分59秒。
2017年,西雅图华盛顿大学得到了这项嘉奖,而他们的社交机器人平均连续交谈时间为10分22秒。亚马逊希望通过帮助更多开发者开发出能够进行更长时间自然对话的机器人,让这些这些学生小组能够帮助亚马逊和Alexa找到保持更长时间自然对话的最佳方式。
谷歌Assistant

谷歌Assistant目前主要出现在五款谷歌Home系列智能音箱中,而谷歌Assistant则是这些设备背后的大脑。与Alexa不同的是,Alexa既是语音助手的名称,也是启用Alexa智能音箱的默认唤醒词,但谷歌Assistant则会响应包括“OK,谷歌”和“Hey,谷歌”等不同的唤醒词。
就像Alexa(当然下面的Siri也是如此)一样,你可以向谷歌Assistant咨询当地的天气、交通状况等信息,还可以让它帮助我们调整智能照明系统,当然它能做的还有更多。
谷歌Assistant在自然语言会话方面功能也相当强大。我特别喜欢使用谷歌Assistant与谷歌Nest Hub智能显示屏配合来指导我制作晚餐。这位语音助手在我执行这些步骤的时候可以非常耐心:比如我可以要求它立刻返回到上一个步骤,或者重复当前步骤,甚至询问下一步应该如何准备、需要多少原材料、以及如何进行烹饪等等(如果有的话)。
此外,在谷歌2019年的I\/O年度开发者大会上,还推出了一项新功能,那就是我们可以直接说“停止”来关闭闹钟,而不必在每天早上迷迷糊糊的状态下还得先说一句“嘿,谷歌,停止”。
这家搜索巨头还在I\/O大会上推出了一款名为“Duplex on The Web”的产品,这是Duplex软件的后续版本,该系统可以在电话线的另一端准备好一位人工智能语音助手,帮助你完成预约和预订等操作。因为听起来相当真实,对方甚至不一定能听出来自己正在与一位人工智能语音助手对话。
Duplex on The Web是基于文本而不是基于语音技术的系统,这让谷歌Assistant可以帮助我们预订晚餐,而且它会使用自己所拥有所有关于用户的信息来自动填写在不同网站上的详细信息。这个想法从理论上来说是合理的:让科技为我们租赁汽车以及完成其他基本信息的输入任务,但我实际上并不知道它实际上的工作原理是什么。不管怎么说,我个人来说肯定更喜欢基于文本系统的Duplex系统,而不是基于语音的人工智能技术。
苹果Siri
与亚马逊以及谷歌相比,苹果在推出智能家居产品方面行动比较缓慢,但它仍然是该领域一个最主要的竞争对手。目前苹果只有一款智能家居设备,既不是iPhone、iPad和Mac,而是HomePod,我们可以用苹果Siri语音助手来控制它。
通过Siri的语音命令(以及iOS系统中的Home应用),我们可以控制与苹果HomeKit平台兼容的智能家居产品。与亚马逊Alexa和谷歌Assistant一样,你同样可以说:“嘿,Siri,把我的走廊恒温器调到24度”这样的命令,或者询问一些比较基本的问题。
虽然Siri大部分情况下能够很好的与兼容HomeKit的第三方智能家居设备进行交互,但在回答普通问题和理解自然语言的能力方面,要稍稍落后于亚马逊和谷歌。
幸运的是,在2019年的WWDC上,HomePod已经得到了一些改进,而这将有助于提供一些新功能,包括多种声音识别、将音频从iPhone传输到HomePod,以及在iHeart radio、TuneIn和Radio.com上播放实时广播等。
Alexa和谷歌Assistant目前已经具备了多用户语音识别能力,这意味着它们可以区分不同用户之间的不同声音(至少在某些时候如此)。因此,让Siri能够分辨出不同说话人的身份,是我们一直都在期待的事情,毕竟这是一项非常受欢迎的功能。这也意味着Siri可以在提醒、音乐推荐和其它专属定制的功能方面发挥作用。
另外,苹果还在WWDC上发布了一种名为“Neural Text to Speech”的系统,该系统应该能让Siri的声音听起来更像普通人而不是人工智能助手。我们将在今年晚些正式发布的iOS 13系统中体验到它的实际效果。
三大语音助手现状

显然,亚马逊Alexa在不需要每次都说唤醒词的情况下实现多个请求,这是一个巨大的进步,即使目前该计划还处于刚刚开启的状态。而谷歌的“无需唤醒词直接停止”的功能也显示了该技术的发展趋势。这让我们减少了对唤醒词或短语的依赖,让对话显得更加自然生动。
虽然我们在今年的I\/O开发者大会上没有听到更多关于基于语音的Duplex软件介绍,但是Duplex功能在网络上已经可以大幅简化冗杂的网络词汇,这对提升用户体验来说相当具有吸引力。
另外一方面,就连苹果也在加快自己的步伐,努力推出新的语音识别功能以及语音神经文本软件,希望让Siri听起来更人性化。
如果仔细看看,其实三家公司彼此之间都有一些共同之处,那就是都与简化对话过程有关,使它们听起来更像人与人之间自然的对话。我完全赞成丢掉一些重复的唤醒词来简化对话的做法,但是让人工智能听起来如此人性化和自然,以至于我们甚至无法区分语音助手和人类本身,这个想法让我有点感到恐惧。详细一定不止我有个人有这样的想法。
对于智能家庭语音控制市场来说,这是一个非常有趣的时代,整个市场形成了“三足鼎立”的局面。根据2018年的一项研究显示,尽管亚马逊Echo的销量更大,但谷歌Assistant是目前最聪明的语音助理,不过亚马逊Alexa正在不断缩小差距。
我们可能正在进入一个更加深入的阶段,也就是对语音助手不断改进的时代,而不是像我们在该技术问世最初几年所看到的那样。而这些循序渐渐式的改进和提升,最终会让智能语音助手在我们的生活中扮演越来越重要的角色。