扫一扫
分享文章到微信
扫一扫
关注官方公众号
至顶头条
ZD至顶网软件频道9月8日消息:今日,百度世界2015大会在北京中国大饭店举办。上午百度董事长兼CEO李彦宏通过与机器人助理“度秘”的对话,了解到其服务功能强大,显然此次百度在人工智能上下的血本不少,一定要“连接人与服务”。
百度技术部刘洋
那么,度秘的研发技术怎么来的?下午百度技术部刘洋为我们解惑,并且就百度在智能语音技术上的重大创新进行解读。
百度在智能语音技术上投入了什么?有什么产品及重要的技术成果?就是LSTM升学模型,刘洋称,LSTM即长短时记忆网络模型,一句话,即模拟人脑。可以达到的算法优势即是,1.长时间的轨迹记忆和瞬态记忆的统一;2.模拟人脑选择性遗忘;3.更精准的轨迹建模。这所带来的技术创新是混合多层结构,解决海量数据训练的效率和稳定性问题。随着语音识别精度不断提升,这种技术的提升带来错位的10%。
刘洋介绍,百度语音识别声学并行训练平台有近700台GPU机器,每台4块GPU带来10倍加速。
另外推出的新技术是,智能描述人的说话,升学模型自适应。刘洋称,推出算法,为每个人推出个性化模型,错误率下降10~15%。目前已经上线,海量语言模型快速更新。
我们都遇到过在进行语音交互时,都需要按一下,才开始说。有时表达不明白,有时有口头语,那智能机器人如何进行精准语义理解,并准确回应,如果遇到在进行多轮语音交互时,可否实现。刘洋,在现场也展示了最新的研发demo,百度开发智能语音,实现自然交流。达到精准语义识别,预计明年上线。
她还介绍了,百度的语音合成技术,深度学习在语音合成中的技术创新,可以面向大数据与个性化的语音合成技术,旨在让每个人成为专业的播音员。
他介绍了百度三个技术方向,
一、随机数字串声纹验证:实现注册、登陆账户,错误率降低到千分之一。
二、个性化TTS音频内容检索:音乐、电视视频等,保证99%以上检索出来,完成语音交互的个性化需求。
三、开放平台:语音开放平台能力,识别、合成
最后,刘洋表示,通过这三种技术方向打造12个应用场景,可以为不同行业的企业和个人用户提供优质的语音服务。
如果您非常迫切的想了解IT领域最新产品与技术信息,那么订阅至顶网技术邮件将是您的最佳途径之一。
现场直击|2021世界人工智能大会
直击5G创新地带,就在2021MWC上海
5G已至 转型当时——服务提供商如何把握转型的绝佳时机
寻找自己的Flag
华为开发者大会2020(Cloud)- 科技行者