至顶网›软件频道 ›产业观察›百度语音技术获重大突破开发者将享受先进成果

百度语音技术获重大突破开发者将享受先进成果

扫一扫
分享文章到微信
扫一扫
关注官方公众号
至顶头条

百度语音识别能力早已在百度开发者中心对外开放。为了推广语音技术的产业化应用，百度还于近期举办了“百度开发者创新大赛——智能语音2015”，提供丰厚奖品、免费APP推广资源等，鼓励开发者调用百度免费开放的语音识别能力，开发出创新的移动应用。

来源：业界供稿 2015-11-04 16:38:02

ZD至顶网软件频道消息：最近，在语音技术领域，最热的话题莫过于百度在汉语语音识别技术方面获得的重大突破——该技术能够做到在安静环境下，汉语普通话语音识别的准确率接近97%。于是，一些创业的朋友来问，开发者能不能使用这项基于新技术的语音识别能力？

经过多番询问，得到的答案是肯定的。

实际上，百度语音识别能力早已在百度开发者中心（http://developer.baidu.com/）对外开放。为了推广语音技术的产业化应用，百度还于近期举办了“百度开发者创新大赛——智能语音2015”（大赛官网http://developer.baidu.com/event_entry/voicedev2015），提供丰厚奖品、免费APP推广资源等，鼓励开发者调用百度免费开放的语音识别能力，开发出创新的移动应用。

而不久之后，基于此次重大技术突破、拥有更精准识别率的语音识别能力，也将登录百度开发者中心。

那么，这次技术突破到底有多牛？能给开发者带来什么？

“百度研发出了基于多层单向LSTM的汉语声韵母整体建模技术，并成功把连接时序分类（CTC）训练技术嵌入到传统的语音识别建模框架中，再结合语音识别领域的决策树聚类、跨词解码和区分度训练等技术，大幅度提升线上语音识别产品性能。”

这是百度语音技术部负责人贾磊的介绍，听上去是不是只有一个感觉——不明觉厉？反正技术君有这样的感觉。

于是，技术君经过艰苦努力，用一句更“人类”的语言来解释这个技术，那就是：这技术牛，非常牛！它成功攻克了语音识别领域十多年的一个技术困局，使汉语语音识别相对错误率再次大幅下降15%以上；基于这一技术，在安静环境下，汉语普通话语音识别的准确率接近97%。因为这一重大突破，贾磊还受邀在全国人机语音通讯学术会议（NCMMSC2015，注：NCMMSC是中国人机语音领域最权威的学术会议）上发表演讲。

更简洁来讲，我们看到的好处就是：

1. 语音识别准确率提升。

2. 语音识别速度提升。

3. 语音服务提供者的投入成本降低。

4. 语音技术领域研究人员可参考百度技术模型，改善自己的研究，从而在语音领域获得更大突破。

还是不明白？想象一个场景：

你在大街上一边走，一边想查找附近的百货大楼怎么走，于是，你打开地图APP，点开语音按钮，说着“百货大楼”。1秒、2秒、3秒……终于，APP返回了结果——“白佛大罗”。看到这些字，你的内心此时是不是很崩溃？

当然，上面这个场景描述地夸张了点，现在的语音识别技术已经能比较准、比较快地识别出来了。而百度研发的这个新技术，能够比现有识别能力识别地更准、更快，而且能降低噪音、口音、说话距离远近等因素对识别率造成的不良影响。

作为开发者，这个能力带来的效果是显著的。在调用百度的这一能力后，能让APP的语音识别服务更精准、更快速，从而提升整体用户体验。你是不是也想试一试了呢？