智能音 箱技能不断增加,多轮交 互问题亟待解决

 新闻中心     |      2019-03-15 15:35

3月8日,谷歌为其包括Google Home Hub、Lenovo Smart Display、JBL Link View和LG XBOOM AI ThinQ WK9在内的 带屏智能音箱添加了持续对话(多轮交互)能力。以解决 用户在与智能语音助手交互时需要多次使用唤醒词进行唤醒的问题。



  据悉,这一功能是谷歌在2018年5月I/O大会上针对Google Assistant与“打电话”技能一同发布的技能。在发布会上,谷歌CEO Sundar Pichai曾表示,他希望 谷歌的智能助手可以自然地与人进行交谈。“用户现在可以与Google Assistant对话时,如果你想问一个问题,你可以不断询问,而无需反复说出「Hey Google」唤醒词。”


  据雷锋网了解,这一功 能此前已经应用到谷歌的Google Home、Google Home Mini和Google Home Max不带屏 幕的智能音箱上。在推出时,首先针 对美国智能音箱用户进行了配置。具体功能方面,谷歌官 方给出的解释是:Google Assistant在听到 唤醒词或回复用户问题后,将保持唤醒状态等待8秒。


  智能音 箱技能不断增加,市场销量稳步上升


  智能音 箱走过五个春秋,整个市 场开始稳步增长。


  在技能方面,智能音 箱已经基本能够实现与用户的日常交互,包括查天气、讲故事、 听音乐,甚至带 屏智能音箱也能够加入视频类功能。


  根据Voicebot统计数据显示,2018年谷歌 的智能语音助手Google Assistant开放给 美国用户的技能数量为4253项;Alexa开放给 美国用户的技能数量为56750项。


  在国内,据阿里天猫精灵在2018年3月春季 发布会上公布信息显示,天猫精灵系统中,目前已经拥有356款技能,有6500名开发 者在围绕天猫精灵做新应用的开发;据百度在2019年2月小度 战略发布会上公布的数据显示,DuerOS语音技能数量1000+,开发者数量达到27000+。


  由此可见,智能音 箱在拥有的技能方面已经逐渐涵盖用户日常生活、休闲,甚至部分学习的需求。


  也由此,智能音 箱也得以卖个好销量。据此前市场调研公司Strategy Analytics公布的2018年第四 季度全球智能音箱市场报告显示,2018年第四季度,全球智 能音箱市场出货总量为3850万台,环比增长95%。其中,排名前 五的依然为亚马逊、谷歌、阿里、百度、小米,出货量依次为1390万台、1150万台、280万台、220万台、180万台。


  智能音箱“变种”频生


  智能音 箱的市场向好也带来了诸多“变种”,从最初的智能音箱,到带屏智能音箱,再到融合电视场景。


  相较而言,智能音 箱被视为入口级设备,也是巨 头玩家争夺的战场。包括国内诸如阿里、百度在内的巨头厂商,已经明 确价格补贴的打法,腾讯、华为虽 然起步在这一领域起步较完,但也已 经推出自家智能音箱。包括国外巨头厂商在2018年推出智能音箱时,定价策略也略有调整。


  与此同时,智能音 箱的变种成为一种常态。以包括亚马逊、谷歌、阿里、百度等 国内外巨头均已布局的带屏智能音箱为例,在经过 近两年的市场推广和用户体验,市场反 馈已经从最初的质疑转向普遍接受。


  雷锋网 在针对此类带屏智能音箱进行长时间的使用和体验后发现,其实带 屏智能音箱在功能上与平板电脑的「娱乐」功能为主略有差异,带屏智 能音箱现在仍以语音、视频类功能为主,更趋向「休闲」调性。


  此外,为了强 调语音功能和培养用户使用语音的习惯,诸如视 频类应用也与平板及电脑略有不同,舍弃了 相应键鼠操作功能,更多依赖语音控制。以小度在家1S上的爱奇艺界面为例,舍弃了 诸如侧栏的导航栏,VIP账号登 录也需要通过手机扫码进行授权登录。


  智能音 箱的另一类变种是结合电视应用场景的魔盒。2018年5月,阿里巴 巴达摩院人工智能实验室和优酷联合推出天猫精灵魔盒;2018年9月,百度与爱奇艺、歌华有 线联合推出歌华小果;2019年2月,百度发 布小度电视伴侣。


  以最近 发布的小度电视伴侣为例,官方给 出的功能解释标签为「Hi-Fi家庭影院+高性能4K机顶盒+高端人工智能音箱」三合一。电视打开时,可以作 为语音控制的机顶盒对电视进行语音控制;电视关闭后,小度电 视伴侣也可以作为「智能音箱」进行应用,包括查询天气、播放音乐等基本功能。


  这些智能音箱的“变种”作为同 样以语音功能为核心能力的智能硬件,最核心 的需求自然也是理解能力,以及流畅的交互能力。


  多轮交 互问题亟待解决


  在这样 的产品带动和市场推广下,智能语 音系统也在逐渐普及。而被视 为下一代交互方式的智能语音系统其实目前虽然已经能够实现基本的交互功能,但是在交互的流畅性,尤其在 多轮对话能力上尚待提升。


  其实,各大厂 商也早就这一能力进行研发和适配。据雷锋网了解,在谷歌之前,亚马逊于2018年3月为其智能语音助手Alexa添加了名为「后续模式」(Follow-Up Mode)的新技能,也正是 用于解决这样的问题,通过后续模式,Alexa会在回 复用户问题后保持唤醒状态等待5秒,看用户 是否有其他问题;强行让Alexa重新进 入待机状态可以使用「thank you」或「stop」这两个词来结束对话。


  相对而言,国内智 能音箱的多轮交互能力稍有滞后,据雷锋 网此前对多个品牌智能音箱进行适用,某些品 牌音箱也只是针对部分问题在回答后会等待第二轮交互,多数情况下,仍需多 次使用唤醒词进行唤醒。不过,据此前景鲲透露,百度今 年晚些时候会发布DuerOS针对交 互能力的能力提升,针对现 在需要频繁使用“小度小度”唤醒词 才能唤醒的智能音箱,交互体 验将会进一步得到改善。


  智能音 箱如果想要变得更智能,首先要 解决都就是沟通障碍问题,如何通过语义理解,使得智 能音箱更好理解用户问题,并在适 当时候等待下一轮交互,从而实 现更自然的沟通则是现在亟待解决的问题。


  毕竟,唤醒词这东西,用多了也是很烦的……