视频回放｜Cerence In Motion：增强语音及新模态交互体验

2021-03-26

微信文章

视频回放｜Cerence In Motion：增强语音及新模态交互体验

通过打造更快、更智能、更强大的出行体验，Cerence 将助力车企实现将驾驶者的数字生活延伸到移动世界。Cerence 推出的一系列增强功能和新产品，集成了语音增强技术，为其核心产品和服务的组成部分，将为驾驶者带来更多新模态交互体验。

“

在加强语音交互能力同时，我们将开发更多车载多模态交互方式。像人与人交流一样，不单是使用语音，而是结合语音、手势和视线等进行互动。将视线识别技术引入AI对话式平台，我们创造了全新的车载交互模式。此外，我们的创新和解决方案的重点是涵盖车内所有乘客，不是仅仅局限于驾驶者和前排乘客，而是可以实现驾驶者、乘客与车外兴趣点互动。

——Stefan Ortmanns

Cerence 集团执行副总裁及核心产品业务总经理

新模态交互——创新人车交互体验

全新Cerence Look 2.0提供了一种崭新的、自然交互方式，让驾驶者与车辆周围环境直接互动，结合新颖的环境重建、现有的硬件和汽车传感器数据来传递有关驾驶者途经的兴趣点信息。从此，车载助理将变身为一个直观、见多识广的出行伴侣，它对驾驶者在旅途中遇到的所有事物了如指掌。例如，当你看到一个景点，你只需要说“这是什么” 或“告诉我左侧建筑物的更多信息”。或当你看到一家餐厅时，可以向助理询问餐厅的营业时间，甚至可以要求它预定餐厅。助理将为你提供所有需的信息，以及交待必要程序。

值得一提的是，Cerence Look已率先应用在梅赛德斯-奔驰新一代MBUX的全新“Mercedes Travel Knowledge”功能上，通过视线识别一栋建筑物，获取旅途中所需的信息，从而创造了一种更快捷、更高效的交互方式。Cerence Look 是一个超级智能的新产品，让语音助理功能得到极大的提升，不但将驾乘者与车外周围环境连接在一起，这项技术还可以应用到车内所有区域，实现驾乘者与汽车全方位互动。当你看到通知警示灯，只需向助理请求帮助或询问更多的细节。Cerence Look使驾驶者、乘客与汽车的互动比以往任何时候更简单容易，并对其汽车加深理解。

（图片来源：梅赛德斯-奔驰官方网站）

对话式AI助理语音增强技术加持

一直以来， Cerence人工智能音频处理技术处于行业领先的地位，在处理行驶中汽车的复杂声音场景中取得巨大的成果，不断提升车载助理在语音信号增强、排除噪音干扰、对话内容的准确度和说话人位置的能力。

Cerence的人工智能音频产品（Audio AI Suite）是Cerence核心平台重要组合部分，尤其适用于干扰强、噪音大的环境。Audio AI 产品支持多种应用，例如，提高免提通信的音质，包括打电话，启动打断和唤醒词或just talk功能的语音对话，或是实现多座位语音识别。要想理解语音，首先必须能听清楚声音。这意味着什么呢？高语音清晰度与语音信号之间有很大的相关性。

“

如果你想获得世界一流的通信和语音体验，我们需要驾驶者和乘客清晰、准确的语音信号输入。

”

全新的语音信号增强技术（SSE）

因此， Audio AI产品以新的、基于深度神经网络（DNN）的信号增强技术为基础，降噪功能更优良，还有新的波束形成技术。通过Cerence的全新的语音信号增强技术（SSE）可提供高品质语音质量，降低各类稳态噪音和非稳态噪音，让用户都能获得一流的音频质量。无论是免提通话，还是与语音助理对话，亦或是与车内其他乘客交互，此外，新的基于DNN的解决方案，其处理能力将越来越完善。现在，为创造世界一流体验，必须确保用户能访问车载内容，使用所有列表中的功能。

多区域、全座位语音支持

Cerence的多座位解决方案可以将座舱设定为多个私人空间，在不同区域的乘客可以同时与系统互动。例如，驾驶者设定了通信区域，便可以让他/她在不被其他乘客干扰的情况下拨打电话。而后排乘客可以与语音助理说 “摇下我的车窗”。多分区处理后的音频非常明显得到提升，对乘客来说是更优秀的体验。

为实现这一功能，Cerence采用了多座位智能解决方案。首先，将波束形成技术与乘客干扰技术结合在一起，新的多座位解决方案能够以近乎完美的速度限制其他区域乘客说话声音的干扰。即使在进行通话中，乘客也可以动态启用或关闭分区功能，这毫无疑问为用户带来了多区域免提电话的全新体验。多座位语音识别可以支持多达8个分区使用识别和打断功能。结合分区识别和Cerence Drive全新1x架构，新的多座位解决方案能够同时处理来自多个座位的实时语音对话。

新一代车内通信系统（ICC）

乘客之间的谈话，尤其是前排和后排乘客之间的对话，常常受到车辆行车噪音的影响，另外驾驶者和前排乘客说话时朝向挡风玻璃也会影响语音质量。

这就是说，为了让后排的乘客能听清楚，驾驶者和前排乘客说话的声音要比平时大，但大声说话久了会让人难受，尤其是乘车时带着孩子，体验感会更糟糕。Cerence的车内通信方案解决了上述问题，可以提供前排与后排乘客高清晰度的对话质量。

ICC系统采集专用座位麦克风的语音信号，并通过语音系统进行分配。这意味着前排乘客的语音信号是通过后排扬声器播放的，反之亦然。ICC不仅提高了通话质量，同时还降低了驾驶者的认知负荷。新一代的语音增强技术不单采用了新型超定向波束，增强自适应控制的反馈分离，还优化了3排座位的解决方案。

Cerence正在尽一切努力为驾驶者提供安全驾驶和无与伦比的车载体验。Cerence Look是对话式AI平台的一部分，提供用户在车内，以及与车外环境的全新自然交互方式。Cerence人工智能音频方案提供了最优化的语音质量，让车内的每位乘客均可获得个性化的交互和操控体验。马上打开Cerence In Motion 视频回放，观看Cerence 集团执行副总裁及核心产品业务总经理Stefan Ortmanns介绍增强的人工智能音频方案及新模态交互体验。

▲Cerence In Motion视频回放

有关Cerence的核心技术、产品及解决方案，请访问www.cerence.com/cerence-products/core-technologies/

进入微信链接

相关文章

移动世界的最新新闻和观点洞察，了解最新资讯。