扫一扫
分享文章到微信
扫一扫
关注官方公众号
至顶头条
ZD至顶网软件频道消息:对于很多刚毕业的人来说,工作的前几个月还在不断学习,还在默默无闻地做一些底层的事情。而他,一个刚毕业不久的百度工程师,就在语音智能技术的发展史上,刻印下了自己深深的足迹。这个足迹到底有多深?他,又是如何成就了这一刻?
为了找寻到答案,笔者与他对话了整整两个小时,记录下了成功的内因与外素,或许能为一些快要毕业或刚毕业不久的人带来启示。不过,出于人才保护的需求,笔者答应不公开名字,而以“他”来进行描述。
下面,就一起跟着我们的主人公走进那艰苦研究的日子——
十年难题,一朝攻克
“哇!这次成功了!”看到实验数据的他,兴奋地呼唤来身边的同事,每个人脸上的喜悦都难以掩饰,安静的办公室里一下子欢腾起来——这一刻,他记忆犹新:十年难题,一朝攻克,这种突破重重障碍,获得成功后的喜悦已不是一般的词语能够表达的了。
“这次你们取得的技术,有多重大的意义?”作为非技术研发人员,我还是有些疑惑。
他没有说话,而是在电脑上敲了一阵,然后把屏幕转向我。“看,很多媒体都在关注和报道这件事。”
《对人工智能多点耐心百度汉语语音识别获重大突破》、《百度打破汉语语音识别领域技术壁垒》、《百度语音技术获重大突破开发者将享受先进成果》……我一篇篇点开链接,大致看了一下报道内容,其核心主要是“百度此次的技术创新,使得语音识别相对错误率比现有技术降低15%以上,使汉语安静环境普通话语音识别的识别率接近97%。这是继2011年,引入深度学习技术,相对错误率降低20%~30%之后,语音技术领域又一次具有标志性意义的重要进展。”
我自嘲有些“不明觉厉”,他很耐心地解释到:“我们现在经常会对着某个手机应用说话,然后手机会将其翻译成文字,这主要应用了语音识别技术,是人工智能领域的一个分支。这个技术的优劣表现在我们的实际应用中,就是识别地更准确、更快,而且,对产业来说,提供语音识别服务的成本更低。”
经他这么一说,我倒回想起来:以前,对着一些手机应用说话,翻译出的文字,并不是很准确,而且时间上有一定延迟,而现在似乎准确了很多、也快了很多。
“是的,这就是技术进步所带来的效果。”他说,“而我们这次攻克了十多年来世界范围内的一个难题——成功地将LSTM(长短时记忆模型)和CTC(连接时序分类)建模技术结合应用在语音领域,让语音识别准确率得到了一次很大的提升。识别得更准确、速度更快了,同时,产业的应用成本也将更低。我们部门的负责人贾磊,也因为这项技术突破,受邀参加全国人机语音通讯学术会议,发表演讲。那可是中国人机语音交互领域最权威的学术会议!”他的言语中透着自豪感。
十年难题,一朝攻克!“你觉得是什么原因,让你们能够成功打破十多年来别人都没有克服的难题?”我又问。
“选对平台,刻苦坚持。”他沉思了一会儿,告诉我。短短8个字,却蕴含着很大的深意——
选对平台,站在巨人肩膀上舞蹈
在媒体报道中,有这样两段描述:
“LSTM和CTC建模技术结合,其核心难度之一就在于海量数据下的深度学习需要强大的计算能力,这两项技术的计算量比传统深度学习的计算量大一个数量级。直接按照数学公式去实现上述算法,LSTM和CTC训练就需要采用单帧递推模式,这样的训练速度在工业条件下的将近1万小时训练数据下,几乎是不可能实现的。”
“对比谷歌2015年9月份于Interspeech 发表的在英文领域的类似研究成果,百度的训练数据是谷歌的4-5倍,模型训练参数规模是谷歌的10-20倍。而该技术成功突破的核心要素之一就是训练能力的极致提升,大模型大数据下的难度要比实验室小数据小模型的情况下难很多。百度研发出的全新训练算法,更接近工业大数据的产品实践,是可以推广到10万小时训练的全新技术。”
“从这些报道看来,海量数据以及大数据计算能力,是成功的关键要素之一?”我向他求证道。
他点了点头。“目前的科学已经到了数据科学阶段,需要靠海量数据和极致计算能力,来推动科学的进一步发展。”
语音识别技术也是如此,他说,之前提到的十年技术困局,困住大家的是什么?主要就是计算能力。“通过百度拥有的海量数据、大数据平台,以及一些算法创新,我们很好地解决了这个极致计算难题。”
他坦言,如果没有百度这样的大数据能力,这次突破很难实现。
当然,大数据能力是一方面,但更让他意外和感激的是,百度这个平台给予他的机会和空间。
“这是一个很重大的研究项目。当同事告诉我,让我加入项目组共同研究的时候。”他顿了顿,露出了又惊讶又兴奋的模样,然后指着自己说,“我当时就是这样的表情。”
他真的很意外,因为组里的人基本上都是这个领域很牛、很资深的人。“没想到会让我一个新人参与其中”。彼时,他才刚刚进入百度。
作为一个新人,少不了些许拘谨和对老员工的敬畏。“一开始,还想着自己是不是应该完全跟着高T们(技术级别很高的人),帮着他们打打下手就好”。但后来,他发现自己错了。“他们给了我很大的发挥空间,让我平等思考、研究,参与到整个过程中。再后来,我才了解到,不仅在我们项目组,原来这里的氛围都是如此。”
就这样,刚毕业入职的他,担起了这项重担。在机会面前,他成功地抓住了它:这靠得是他的努力与坚持——
成功非易事,常绝望到想放弃
相信很多成功的人都有一个感受,在成功之前,失败是家常便饭。对他来说,亦是如此。
“有时候做出一个推测,感觉很靠谱,但几组试验下来,却没得到想要的结果。”他说,“于是,大家就开始讨论失败的原因,经常会从下午讨论到深夜。”在又累又困中,梳理了几种可能性和解决方案,可是第二天来一试,经常还是不成功。
失败,换方法,再试验……在这个几个月中,他的内心如同起伏的波浪:失落、怀疑,绝望,自我鼓励,再一次坚持。他回忆道:“绝望到快要放弃就有3、4次。”
这是怎样的感觉,也许作为外人难以体会。在一次次失败与自我怀疑中,要坚持下来,更是一个很难感受到的艰辛的心理历程。
然而,就在这一次次的坚持下,成功慢慢地走近了他们。
“有一天晚上,和平常一样,我们研究着某个方法为何失败,该如何解决。”那天,从晚上7、8点研究到12点多,最后,竟然发现了一种解决方案,一举解决了技术上的一大难题。这一天让他印象深刻,不仅仅因为技术上获得突破,也因为那一天他和女友有个重要约会,而自己爽约了。
回顾这次成功,他很感慨,自己没有放弃而是坚持了下来。
他说,如果没有给他这个机会,他不会取得这次成功;如果没有技术大牛在研究过程中分享经验,提供思路,他不会取得这次成功;如果没有百度的大数据能力,他不会取得这次成功;如果没有坚持到最后,他不会取得这次成功。
的确,成功并不容易,需要内因和外因多个因素共同作用。有眼光、有能力,选对平台和道路,并且能努力奋斗、持续坚持的人,相信成功离他并不遥远。
如果您非常迫切的想了解IT领域最新产品与技术信息,那么订阅至顶网技术邮件将是您的最佳途径之一。
现场直击|2021世界人工智能大会
直击5G创新地带,就在2021MWC上海
5G已至 转型当时——服务提供商如何把握转型的绝佳时机
寻找自己的Flag
华为开发者大会2020(Cloud)- 科技行者