
盘点火出圈的电器语音交互产品,我们发现这些前景和难点
语音是人类沟通交流和获取信息最自然便捷的方式。家用电器带有语音交互功能的产品越来越多。
用户可以通过语音唤醒和操作不同的终端设备,大幅改善交互的便利性,提升用户体验。

语音交互是人机交互技术中最吻合人类自身交流形态的技术:
- 解放双眼、双手,无需借助于外物;
- 自然语言交互;
- 类似于人际间的人性化交流。
家居场景因为环境比较私密和封闭,噪音较少,是很好的实现语音交互的场景。而且家用电器一般长期带电,满足语音交互功能的基本要求,因此语音交互一度被认为是未来人与家居交互的主要入口路径。

按照控制模式,语音交互主要可以分为两种模式:

这种模式下,人对智能音箱说话,智能音箱将信号发到云端解析后,将控制指令再发给电器。一般只有同一生态的产品才能够实现这类互联控制。

这种模式下,人直接对着电器说话,电器也直接完成语音识别。
按照后台处理方式,可以分为离线语音和在线语音两种技术实现形式。
离线语音是在电器产品上嵌入语音模块实现简单的语音激活、语音识别、语义理解等功能。特点是能识别的语句内容有限,无需联网,反应较快。

在线语音通过互联网将语音信息发送到云端的语音处理系统,将语义理解交由云端强大的计算机处理,并可从网络中检索到更多信息(比如天气、音乐、故事等)反馈给用户。在线语音的特点是:语义识别能力强,可提供海量服务内容。

目前市场上已开始出现离在线语音混合处理的模式:简单的命令在本地处理,复杂的语句再上传云端分析。取长补短,提升用户体验。


与音箱、手机等对比,电器设备工作时,除了家居环境噪声,还有自身工作产生的本体噪声。想要获得好的语音识别效果,从麦克风和扬声器的选型到结构安装,都需要满足严格的声学标准;只有在满足了基础器件选型和结构设计要求的前提下,麦克风才能捕捉到最优的语音信号,只有最优的语音信号送到识别引擎才能获得最好的识别效果。


家电品类繁多,覆盖日常生活的方方面面。各年龄段、各地域的用户都会使用家电,甚至没有主次之分,因此需要适配不同年龄段、不同地域人群的声音特征,对声学模型鲁棒性具有较大的挑战。
针对每种方言都需要专门构建声学模型和语言模型,训练流程非常复杂。目前的方言识别方案都只是支持几种群体较大的方言,比如粤语、四川话等,但即便是只支持几种方言,识别的难度依旧较大。
对于用户来说,语音交互产品越来越多,唤醒词和口令也越来越多。

对于家电企业来说,目前还面临着一些技术上的难题:
- 传统家电与新兴技术的跨界融合缺乏经验积累,需大量技术开发和验证经验共享
- 新兴产业没有统一标准,需要行业第三方牵头
- 家居领域语音大数据,录制成本较高
- 平台和供应商卡脖子,数据积累掌握在平台手中
但是相信通过技术不断的迭代发展,未来,语音交互技术将与各种传感器相结合,通过声纹识别,定向拾音,分布式唤醒等技术,不断提升用户体验。

2021年智能家电技术峰会即将回归,敬请关注!
相关阅读:
- 协同创新,引领发展 │ 第五届智能家电(语音识别与交互技术)高峰论坛圆满落幕
- 中国电研联合家电龙头企业,成功立项三项智能家居国家标准计划
- 《智能家电语音识别与交互技术白皮书》重磅出炉
- 各路大咖共探:智能语音技术如何与家电产品深度融合
(参考资料:《2020 智能家电语音识别与交互技术白皮书》)