科技行者

行者学院 转型私董会 科技行者专题报道 网红大战科技行者

知识库

知识库 安全导航

至顶网软件频道产业观察百度技术部刘洋:智能语音技术“模拟人脑”的创新

百度技术部刘洋:智能语音技术“模拟人脑”的创新

  • 扫一扫
    分享文章到微信

  • 扫一扫
    关注官方公众号
    至顶头条

百度在智能语音技术上投入了什么?有什么产品及重要的技术成果?就是LSTM升学模型,刘洋称,LSTM即长短时记忆网络模型,一句话,即模拟人脑。

作者:邓晓蕾 来源:ZD至顶网软件频道【原创】 2015年9月8日

关键字: 百度世界2015 新闻速递

  • 评论
  • 分享微博
  • 分享邮件

ZD至顶网软件频道9月8日消息:今日,百度世界2015大会在北京中国大饭店举办。上午百度董事长兼CEO李彦宏通过与机器人助理“度秘”的对话,了解到其服务功能强大,显然此次百度在人工智能上下的血本不少,一定要“连接人与服务”。

百度技术部刘洋:百度智能语音技术的创新

 

百度技术部刘洋

那么,度秘的研发技术怎么来的?下午百度技术部刘洋为我们解惑,并且就百度在智能语音技术上的重大创新进行解读。


 百度在智能语音技术上投入了什么?有什么产品及重要的技术成果?就是LSTM升学模型,刘洋称,LSTM即长短时记忆网络模型,一句话,即模拟人脑。可以达到的算法优势即是,1.长时间的轨迹记忆和瞬态记忆的统一;2.模拟人脑选择性遗忘;3.更精准的轨迹建模。这所带来的技术创新是混合多层结构,解决海量数据训练的效率和稳定性问题。随着语音识别精度不断提升,这种技术的提升带来错位的10%。

刘洋介绍,百度语音识别声学并行训练平台有近700台GPU机器,每台4块GPU带来10倍加速。

另外推出的新技术是,智能描述人的说话,升学模型自适应。刘洋称,推出算法,为每个人推出个性化模型,错误率下降10~15%。目前已经上线,海量语言模型快速更新。

我们都遇到过在进行语音交互时,都需要按一下,才开始说。有时表达不明白,有时有口头语,那智能机器人如何进行精准语义理解,并准确回应,如果遇到在进行多轮语音交互时,可否实现。刘洋,在现场也展示了最新的研发demo,百度开发智能语音,实现自然交流。达到精准语义识别,预计明年上线。

她还介绍了,百度的语音合成技术,深度学习在语音合成中的技术创新,可以面向大数据与个性化的语音合成技术,旨在让每个人成为专业的播音员。

他介绍了百度三个技术方向,

一、随机数字串声纹验证:实现注册、登陆账户,错误率降低到千分之一。

二、个性化TTS音频内容检索:音乐、电视视频等,保证99%以上检索出来,完成语音交互的个性化需求。

三、开放平台:语音开放平台能力,识别、合成

最后,刘洋表示,通过这三种技术方向打造12个应用场景,可以为不同行业的企业和个人用户提供优质的语音服务。

 

    • 评论
    • 分享微博
    • 分享邮件
    邮件订阅

    如果您非常迫切的想了解IT领域最新产品与技术信息,那么订阅至顶网技术邮件将是您的最佳途径之一。

    重磅专题
    往期文章
    最新文章