“明明白白我的心” 语音交互成无人驾驶汽车刚需

作者：赵东

在复杂的行车环境中，其他的交互模式都不如语音交互来得自然、顺畅，符合人类使用习惯——用耳朵听来做信息的输入，用嘴巴说来做信息的输出。

ZD至顶网软件频道消息：试想，如果有一天人类与机器人对话，会使用什么方式？尤其是当人类指挥一个车型机器人行驶在道路上的时候，是用计算机语言不断给机器人输入代码，还是只是简单地使用人类最熟悉的交互方式——人类语言？答案显而易见。

语音交互成自动驾驶汽车刚需

与传统汽车不同，目前被热议的自动驾驶汽车从本质上看相当于智能化机器人，只是智能程度不同。作为智能程度最高的无人驾驶汽车，即完全自动驾驶汽车，必须具有看、听、说、思考、决策、行动的能力，在城市道路等复杂环境中，这些能力将直接决定无人车的使用体验，甚至是使用者的生命安全。

目前，全球有多家专注于研究自动驾驶技术的公司，百度的无人驾驶汽车项目起步于2013年，由百度研究院主导研发，其核心技术是百度大脑。到2016年7月底，百度自动驾驶技术专利的申请数量超过350项，包括无人车的智能感知与控制、智能检测与定位、高精地图、语音和图像处理、机器学习、无人车测试等国际领先技术。

在这些技术储备中，良好的人车交互是无人驾驶汽车与用户接触的第一步。而在复杂的行车环境中，其他的交互模式都不如语音交互来得自然、顺畅，符合人类使用习惯——用耳朵听来做信息的输入，用嘴巴说来做信息的输出。

事实上，语音交互并不仅局限于无人驾驶汽车，相关调查数据显示，语音交互逐渐在替代传统手动控制，成为智能行车的显著特征之一。

百度在智能汽车以及无人驾驶汽车主要交互方式方面主要采取的就是语音交互模式。百度会把最尖端的语音交互技术放到智慧汽车里去，而语音交互准确度和流畅度每提升一个百分点，都能给驾驶带来的非常明显的体验提升。

语音交互得益于百度人工智能的技术储备

语音交互技术可以让操控和管理汽车更便捷，这项技术已经成为自动驾驶汽车的刚需。对于无人驾驶汽车来说，实现语音交互，听得清是第一步，能听懂是第二步，能反馈是第三步。

“听得清”是实现人机交互体验的第一步，也就要考验语音识别的准确度。事实上，语音识别技术已经经过了多年发展，1970年以后，基于统计语言学方法，IBM将当时的语音识别率从70%提升到90%，语音识别规模也从几百个单词上升到几万个单词。1990年，基于对大量数据加以分析的统计方式来构建机器翻译系统的观点。最近几年，行业开始引进深层神经网络（DNN）的算法，DNN技术为语音识别领域带来了新的突破。

据了解，百度大脑的语音识别现在已经到了第二代，使用深度学习的技术进行语音识别。百度研发出了基于多层单向LSTM（长短时记忆模型）的汉语声韵母整体建模技术，并成功把连接时序分类（CTC）训练技术嵌入到语音识别传统技术建模框架中。该技术能够使机器的语音识别相对错误率降低15%，使汉语安静环境普通话语音识别的准确率接近97%。目前，百度语音识别的准确率能够达到97%，已经超过了人对语音的识别能力。

“听得懂”是第二步，也是人车语音交互中最重要的，只有听懂了人类语言的意图，无人驾驶汽车才能够执行对应的命令。

实现“听得懂”的核心是建立统计语言模型，而语言模型的有效性则依赖强大的计算能力和足够多的数据对该模型进行训练，语言模型越复杂则需要的计算量越大，而巨大、丰富的数据量是保证语言模型输出的准确性的重要基础。

作为一家以搜索业务起家的互联网技术公司，百度具有超大规模的神经网络、万亿级的参数、千亿样本和千亿特征训练；几年前百度便开始自建中国最大的GPU集群，包括数十万台服务器构成了“百度大脑”的实体，也确保了百度强大的计算能力；全网的网页数据、十多年来累积的搜索数据，以及百亿级的图像、视频、定位数据则是百度足以自傲的数据资产。基于此，百度从计算方法、计算能力以及数据能力三个方面，为语音交互技术“听得懂”用户指令奠定了基础。

而语音交互中的第三步——语音合成，也是百度语音技术的优势。基于大数据与深度学习技术优势，百度的新型情感语音合成系统能够让机器摆脱平铺直叙的发声，为用户带来更自然、更接近真人朗读的听觉体验。

目前，百度每天响应的语音合成的请求达到了2.5亿次。在情感语音合成技术上线后，用语音听小说的百度用户从过去平均每天听0.69小时，增长到现在的2.21小时。在刚刚结束的百度世界大会上，通过百度语音合成技术模拟出已逝巨星张国荣的声音，百度CEO李彦宏表示，未来每个人都可能拥有属于自己的语音合成模型。

百度自动驾驶事业部总经理王劲更直言，未来的汽车是由软件定义的，在传统汽车中只有10%的价值来自汽车本身的软件，而未来自动驾驶汽车的价值将有60%来自软件，可以说软件将是未来自动驾驶汽车的核心竞争力。

来源：ZD至顶网软件频道

0赞

好文章，需要你的鼓励

“明明白白我的心” 语音交互成无人驾驶汽车刚需

来源：ZD至顶网软件频道

2016

09/22

16:31

分享

点赞

无万卡，不VLA：元戎启行与阿里云的“想法”和“解法”

AI爬虫让“价格战”变成“算法战”，利润正在被看不见的流量吞噬 AI 爬虫程序流量在短短一年内暴增 300%

做好可持续数字化转型的“必答题”

SUSE Linux Enterprise Server (SLES) 16全新发布：AI赋能，智领企业管理

SAP商业AI获乌镇峰会精品案例奖，助推中国企业实现确定性增长

专访｜Cloudera致力于打造AI时代的企业级“数据操作系统”

专访｜AI浪潮下的“卖水人”：Cloudera解构企业AI的“源”与“治”

SAP TechEd柏林观察：企业AI如何发挥飞轮效应?

CIO策略观察——软件测试：从传统困局到 AI 无人测试转型

体验现在，想象未来：SAP描绘技术与商业蓝图，引领商业AI革新

微软Configuration Manager将改为年度发布节奏

aiOla发布Drax模型，在噪音环境中实现可靠的AI语音识别

百度学术：行业首个一站式AI学术平台，6.9亿文献资源加持

百度2025 Q1财报深度解读：智能云表现强劲，萝卜快跑已拓展全球 李彦宏详解AI战略：AI-first战略使百度保持领先地位

文心iRAG和无代码“秒哒”发布：电子牛马来了，还是成群来的

激光雷达进入战国时代：速腾、禾赛双寡头与门外的野蛮人 | 芯流长文

热点丨马斯克的AI之梦，特斯拉连发三款“机器人”

全球AI落地应用落地案例

文远知行无人驾驶出租车获准在美国加州载客试点

OpenAI API “断供”阴云下国产大模型的危与机

百度CEO李彦宏：文心一言用户数突破2亿，让开发者成为AI时代的主角

有意见 | 百度业绩超预期，AI稳中求进，正是兵强马壮时，只待出击！

如果您非常迫切的想了解IT领域最新产品与技术信息，那么订阅至顶网技术邮件将是您的最佳途径之一

中国移动呼和浩特数据中心：只有高效存力先行，AI才能跑出全力

从“支撑工具”到“智能中枢”，AI原生ERP进化

阿里要用AI将云计算重做一遍

PEC 2025 AI创新者大会

关注官方公众号

关注官方微博

关注官方喜马拉雅

友情链接

业界热点:

百度2025 Q1财报深度解读：智能云表现强劲，萝卜快跑已拓展全球李彦宏详解AI战略：AI-first战略使百度保持领先地位