如今,汽车业向智能辅助驾驶系统和车载信息化的方向发展趋势逐渐加快,语音识别技术在车联网领域的应用已成为车联网智能化发展的助推器。那么什么是语音识别技术呢?其实语音识别是一门交叉学科,涉及到从语言学到通信理论等方方面面的内容。要实现它,也需要海量语料收集、实测模型训练再到识别匹配等等一系列复杂的过程,涉及到声纹、TTS、ASR等等一系列技术,同时也要对一些特定领域有着深入理解。此外,也需要软件、硬件的共同配合协同。总体来说,这是一个需要门槛极高,对专业性、投入等都要求很大的工程。
致力于车载人机交互系统开发、车联网服务平台运营的国内智能汽车运营商车音网,在语音识别方面,拥有十多年的积累,也是中国最早一批开拓中文语音识别商用化、产业化以及车载语音识别的奠基者。为此,本期电子发烧友网汽车电子特刊诚邀车音网创始人兼董事长沈康麒先生探讨车载语控相关问题。
如何抓住用户需求痛点?
与单纯的语音识别公司相比,车音网有很多不同点。沈康麒先生表示,除了车载语音识别之外,车音网同时还拥有车载手机互联以及基于NGTP 2.0标准的车联网平台等核心技术,为汽车主机厂等合作伙伴提供完整的车联网解决方案。在此基础之上,车音网还深入汽车全生命周期,为车企提供后市场服务、用户管理、电商等服务。
然而,语音识别虽好,但是必须要认清,在一些场景下,语音识别并非最佳解决方案,不是不能识别,而是没有必要去用它。例如打开车窗,用手去操作或许比起语音要更为方便。沈康麒先生指出,要摒弃纯技术思维,而要将用户体验放在最重要的位置。
如何衡量用户体验?一方面是语音的识别率,是90%还是95%,这个当然可以用数字去衡量。另一方面,要强调服务的达成率。这一点就与场景、硬件、识别引擎、数据积累、对用户习惯的考量等等都有关。同时,要明白语音识别是一项工具型技术,通过这一工具,能更好满足用户实际的需求,比如语音搜索、语音电台等等。
克服设计挑战 展示独到优势
车音网最大的特点就是专注,发展方向定位在了汽车相关的场景上,多年来见证了车载语音的不断发展,沈康麒先生表示在设计方面有两大挑战:
其一,由于汽车环境非常复杂,有噪音、回声的干扰,对识别技术是一种挑战。例如在采样时,大量收集实际场景下的语料,得到在车载噪音下更好的识别率,同时,在不断探索汽车环境下,用户提出了高频需求。沈康麒先生表示,这些可以不断优化体验效果,让识别的精度更高,随着用户使用,语音识别的模型也在不断完善。
其二,语音技术本身是一项概率技术,任何语音识别的模型都存在一定的局限性,即使该技术能够做到精准,外部的不可抗因素也可能会导致语音识别失效。当然了,车音网提供的车载语音识别,不是一套冷冰冰的智能机器人,一旦用户在使用过程中出现无法识别的问题时,客服专员还会第一时间接入,通过人工的方式满足用户的需求,提升服务的达成率。总而言之,设计者应该更多地以用户的应用场景以及应用需求为出发点,去开发及设计语音产品。
打造中国智能汽车服务运营平台
目前人机交互正在从机械按钮,逐渐过渡到触摸。而在车载环境下,语音交互可以说是当前最佳的人机交互方式,它能极大程度提升驾驶安全性,为用户带来便利,这一点,也越来越多地受到了人们的认可。
沈康麒先生表示,语音识别、车载手机互联以及车联网平台都是车音网的核心技术,在此基础之上,车音网还在开发了自主OS系统,将云应用平台与智能语音平台相结合,围绕车主生活核心需求定义未来智慧车生活。车音网的定位是智能汽车运营商,将遵循为车企提供伴随性服务的原则,围绕整个汽车生命周期,为客户及用户创造更大价值。
同时,车音网也并不是一家传统的TSP公司。他们所做的是为车企提供伴随性服务,搭建一个贯穿车主全生命链周期的服务运营平台,帮助车企做车联网服务的落地,提升用户的满意度和忠诚度,这也就是车音网所说的 “中国智能汽车运营商”,核心在于软件开发和对不同服务的综合运营。
未来车联网、汽车智能的渗透率还将不断提升,对人机交互的需求非常大,更重要的是,在车载环境下,语音识别有着无法替代的优势。从发展的角度来看,那些最专注、最专业的企业,会更有希望最终成为胜利者。沈康麒先生强调,基于语音识别的车联网应用服务,也是我们未来的重点之一,目前语音识别已经炙手可热,整体市场还有很大的潜力空间。