实现人工智能语音交互,必须拥有这七大能力

  • Kino
  • 2017/11/24
  • 车云网

未来的智能语音提供的是一种千人千面的服务。

博泰从2009年开始与国内车厂进行车联网方面合作,包括应用、平台、硬件、软件和数据等各方面。11月23日,在车云联手百度云共同主办的《ABC Inspire 汽车智能高峰论坛》上,博泰行业合作部副总监吕强透露,博泰已经将阿波罗基础平台能力集成在车辆控制,并整合了DuerOS开发擎OS语音交互系统,以及整合百度云开发了擎Cloud,在这个云服务平台上集合了AI能力、大数据能力和第三方接口等各种能力。

IMG_6785.JPG

智能语音交互是人工智能在车联网方面的典型应用,而未来的智能语音一定是在基于出行的基础上,通过用户画像了解用户行为,结合用户历史信息实现千人千面的服务。吕强认为,要实现这样的人工智能语音,必须拥有七种能力。

1、平台层

  • 一个平台:语音交互已经不光是一个系统,而是包括语音识别系统、AI智能识别系统、人脸识别等集合而成的一个平台;

  • 一个语音系统:很多新兴公司在不断的涌入汽车行业,并且提供不同的系统,如何把这些平台和新的系统放到一个平台上去应用,就是我们说的“一个系统”。

  • 多个合作系统:光有一个语音系统解决不了太多问题,它必须要有和生活相关的数据、和应用相关的数据、和工作相关的数据整合在一起,这样的语音平台才是一个真正的AI的语音平台。

2、系统层

  • 一个输入逻辑:一些车型在车机、后视镜等不同智能硬件上使用了不同的语音系统,造成了不同的语音逻辑,对于用户体验来讲非常糟糕,需要一个输入逻辑统一。

  • 多种垂直技能训练:AI是需要训练的,比如百度云结合百度地图、百度音乐等百度各个平台的数据不断训练,这种系统层的训练对于提升AI语音就非常重要。

3、技术层

比如唤醒与自定义唤醒词、连续输入能力、快速语音输入等。

4、数据与数据训练层

数据是AI语音一个非常重要的点。只有基于大数据的训练和并发的能力,才能让语音做到更好更快。

5、AI与自然语言理解技术

包括搜索能力、用户的历史数据、闭环场景。

6、语音转写

语音转写现在也比较普遍了,就是TTS和STT。另外包括出行可以用POI。

7、一个好的语音AI必须要有迭代的能力,包括语音定制化,可以帮助车厂实现他想要的功能,很快上线。此外还有分析报表系统以及语音OTA。

智能车联网推动了车辆智能全场景服务的实现,吕强预测,到2018年,将有30%的人机交互都会通过智能语音来实现,被用户诟病的车内的体验正在一步步得到改善。

更多评论 收起评论

我要说

欢迎您!

退出