至顶网›软件频道 ›产业观察›百度技术部刘洋：智能语音技术“模拟人脑”的创新

百度技术部刘洋：智能语音技术“模拟人脑”的创新

扫一扫
分享文章到微信
扫一扫
关注官方公众号
至顶头条

百度在智能语音技术上投入了什么？有什么产品及重要的技术成果？就是LSTM升学模型，刘洋称，LSTM即长短时记忆网络模型，一句话，即模拟人脑。

作者：邓晓蕾来源：ZD至顶网软件频道【原创】 2015年9月8日

关键字：百度世界2015 新闻速递

ZD至顶网软件频道9月8日消息：今日，百度世界2015大会在北京中国大饭店举办。上午百度董事长兼CEO李彦宏通过与机器人助理“度秘”的对话，了解到其服务功能强大，显然此次百度在人工智能上下的血本不少，一定要“连接人与服务”。

百度技术部刘洋

那么，度秘的研发技术怎么来的？下午百度技术部刘洋为我们解惑，并且就百度在智能语音技术上的重大创新进行解读。

百度在智能语音技术上投入了什么？有什么产品及重要的技术成果？就是LSTM升学模型，刘洋称，LSTM即长短时记忆网络模型，一句话，即模拟人脑。可以达到的算法优势即是，1.长时间的轨迹记忆和瞬态记忆的统一；2.模拟人脑选择性遗忘；3.更精准的轨迹建模。这所带来的技术创新是混合多层结构，解决海量数据训练的效率和稳定性问题。随着语音识别精度不断提升，这种技术的提升带来错位的10%。

刘洋介绍，百度语音识别声学并行训练平台有近700台GPU机器，每台4块GPU带来10倍加速。

另外推出的新技术是，智能描述人的说话，升学模型自适应。刘洋称，推出算法，为每个人推出个性化模型，错误率下降10~15%。目前已经上线，海量语言模型快速更新。

我们都遇到过在进行语音交互时，都需要按一下，才开始说。有时表达不明白，有时有口头语，那智能机器人如何进行精准语义理解，并准确回应，如果遇到在进行多轮语音交互时，可否实现。刘洋，在现场也展示了最新的研发demo，百度开发智能语音，实现自然交流。达到精准语义识别，预计明年上线。

她还介绍了，百度的语音合成技术，深度学习在语音合成中的技术创新，可以面向大数据与个性化的语音合成技术，旨在让每个人成为专业的播音员。

他介绍了百度三个技术方向，

一、随机数字串声纹验证：实现注册、登陆账户，错误率降低到千分之一。

二、个性化TTS音频内容检索：音乐、电视视频等，保证99%以上检索出来，完成语音交互的个性化需求。

三、开放平台：语音开放平台能力，识别、合成

最后，刘洋表示，通过这三种技术方向打造12个应用场景，可以为不同行业的企业和个人用户提供优质的语音服务。