会聊天到底有多重要?它可能是汽车百年后迈出的“进化第一步”

会说话很重要么?当然,小时候如果不会说“我饿!“,笔者现在估计就没命写这篇文章了

“会说话”到底有多重要?

车云菌很难针对这个问题给出一个准确的答案,因为“会说话”背后意味着的“沟通能力”。在电影《猩球崛起》中,猩猩种群的首领“凯撒”之所以能统领一个庞大的猩猩军队,除了借助药物和基因遗传从母亲那里获取了高智商以外,最重要的就是具有和同类的沟通能力;同样的,在电影《钢铁侠》中,辅佐钢铁侠斯塔克处理内务,提供信息建议和策略谋划的最大助手——贾维斯,也是一个只听其声不见其人的虚拟角色,但钢铁侠却能通过与其的语言沟通,获得强大的支持并逐个完成任务,当然,贾维斯这货最后是不是变身奥创有点偏离本文的主题,车云菌在这里就不多聊了。

所以说,具备有效且复杂的沟通能力,其实是区分动物与人类,丛林文明与社会文明的有效工具,对人类和社会尚且如此,对诞生过百年但一直默默无闻的汽车来说,更是如此。事实上,在车云菌看来,当很多人在憧憬如何让未来汽车做到自动驾驶或清洁无污染之时,让汽车“听得懂人话”却是当下对这个“四轮物种”更具现实意义的进化。

眼下,在我们身边,也有越来越多的汽车专注于让自身实现与乘客的“顺畅交流”,对乘客的语言甚至动作都能做到善解人意,而顺应这个要求出现的“自然语音识别”和“手势控制”技术,也都不再是电影中的科幻情节,真真切切地存在于我们身边的车载智能交互系统中。

下面,我们倒是不妨来看看,眼下有哪些款量产车型,可以做到对驾驶者的语音指令“言听”且“计从”。

通用安吉星“OnStar”系统

说起此类系统,上海通用于2009年借助凯迪拉克车型在国内落地的安吉星“Onstar”系统不可不提,其实,这套安吉星系统不单单因其能为车辆驾驶员提供出色的导航和安防服务,最重要的是,其研发原型来自于1962年通用为NASA服务的阿波罗计划。

利用“安吉星”系统,车辆现阶段可以通过车联网系统为驾驶员提供救援(Aid)、信息服务(Information)与Routing(路径导航)等功能,在这一过程中担任车辆和驾驶员“沟通任务”的,则是一个7X24小时侯命的人工后台。大到一个复杂导航路线的查询,小到一个八卦新闻的搜索,驾驶员都可以通过安吉星的一键呼叫向这个人工后台下达命令,并静等反馈结果被发送到车辆上。

不过,作为早期实现车辆与驾驶员沟通的工具,依靠人工后台提供服务的“沟通策略”也存在天然的弊端,比如会受到方言、网络、成本、效率等方面制约。2017年,安吉星新增了自然语音识别技术,融合云服务的车内自然语言交互系统重塑了车主与车辆的交流方法。云端服务器通过海量语音样本不断的自学习以及实现和各领域信息库(如导航兴趣点,歌曲库等)的对接同步,可以实现电话拨号、音频点播、车辆控制、天气新闻股票查询等。“语音助手+人工后台”的双模形式可以更好地兼顾不同的场景,提供了更好的用户体验。

荣威斑马智行(YunOSAuto)智能操作系统

提起能依靠系统而非人工来识别自然语音的智能人际交互系统,搭载在荣威车型上的斑马智行(YunOSAuto)智能操作系统,是国内比较有特色的一款产品。除了向驾驶者呈现一个超大尺寸的竖向屏幕外,几乎取消了所有非必要的功能按钮,言外之意就是想告诉消费者——你想操作的任何功能都可以向我“说出来”,甚至包括打开和关闭天窗这样的操作。

根据车云菌对这套系统的使用体验,其“语音识别”系统的功能很强大,对常规语音命令的识别准确率很高,同时也能理解一些常用的表达方式,不过这套上汽和阿里共同开发的智能操作系统,其最大亮点除了可以识别基本的自然语言之外,还包括可以关联支付宝账号,实现便捷的车上支付,包括且不限于坐在驾驶位上购买流量、加油、预定维修保养、停车缴费等等;如果你还绑定了淘宝账号,这套车载系统还能依据你的个人偏好提供有针对性的个性化推荐,所以这套系统在当下与其说是一个智能化的车机系统,不如说是一个具有移动钱包功能的车机版支付宝。

宝马iDrive自然语音识别系统

作为与通用OnStar同一时期在中国亮相的车机系统,宝马iDrive系统在中国的迭代和演化算是非常连续的,不但从技术角度层面上实现了很多全新技术的首发(新5系上的手势识别),同时还体现在入门级的3系轿车上就能看到的一套NLU(Natural Language Understanding)自然语音识别系统。

这套系统的最大特色就是,它可以按照人类语言的思维逻辑进行理解并操作,而不是程序化的语言模式。换句话说,驾驶员与“NLU”可以按照正常语言习惯对话,而不需要咬文嚼字地去背诵操作指令,甚至你还可以随意打断它。

举个例子来说,比如,通过导航搜索某个地址,你只需要说:“我要去某某地方”,它就能明白你的意图,直接启动导航,并进行地址搜索,功能一步到位。而要取消这一功能,你也只需要说一句,“别导航了”就这么简单;再比如,将收音机调到FM88.7MHz,你也只需要说:“我想听887”,就可以完成操作。这比传统的语音控制那种繁琐而又不符合人类语言习惯的操作方式,要智能得多,也比你去分神在idrive系统中选来选去的操作,还要方便、安全得多。

需要说明的是,眼下很多品牌的自然语音识别系统都是由第三方提供技术支持,宝马的这套语音系统就是和国际语音巨头Nuance合作的,而作为国内自然语音识别领域的领军企业,科大讯飞也在提供这方面的服务,目前主要应用在自主品牌车型上。

全新绅宝D50车载互联系统

在全新绅宝D50这款车上,支持自然语音服务的“小绅”车载互联系统是一大亮点,和宝马NLU系统能识别复杂的语音指令的能力相似,由科大讯飞提供技术支持的“小绅”也可以识别驾驶员发出的复杂语音指令,不再受特定句式、特定命令词限制:譬如“我要去香山八大处公园,需途径中石化加油站”这样必须进行逻辑分析的复杂指令;而且,“小绅”也和目前市面上最先进的自然语音识别系统一样,可以识别多种地方方言并可支持11种口音的语音播报,并可以像宝马的NLU系统一样,支持打断系统的中途播报,及时让系统响应新命令。

除此之外,全新绅宝D50这套自然语音识别系统比较有特色的是,支持用户自定义系统激活用语,而且通过科大讯飞精准拾音、回声消除、陈列降噪和远场降噪等技术,实现了对前后排用户语音指令的区分识别,让每一个乘员都可以享受到声控的便利。

车云小结:

借力于国内智能汽车网联技术高速发展的优势,语音识别得益于业内充足的技术储备和大数据支持,也在这几年里得到了长足的发展,目前也遇到了一些难点需要攻克,比如有些时候人并不是把任务中的所有要求细节都说出来,需要通过多次人机对话逐步沟通。要让语音助手领会人的意思,还需要积累更多有关个人习惯的数据,通过机器学习的方式来集成到语音助手系统内,将麦克风阵列、前端声学处理、语音唤醒、端点检测、语音识别、语义理解、语音合成等技术在整个交互链上进行深度融合,并且支持全双工、多轮交互等新特性。

在未来几年,这个技术将依托于自身的诸多优点以及对人与人沟通方式的忠实还原,毫无疑问地成为发展最迅速人机交互工具。届时,一个“能听懂人话”,明白“乘车人员意图”且可以准确无误执行命令的“车辆大脑”,将成为汽车进化,颠覆设计甚至实现自动驾驶的前提与技术基础。

更多评论 收起评论

我要说

欢迎您!

退出