ZD至顶网软件频道消息: 在不久前的中国大数据产业峰会上,百度创始人、董事长兼CEO李彦宏在主题演讲中畅想了一个基于人工智能技术的“无人车城市”。在李彦宏的眼中,以无人车构建起来的智慧城市并非空中楼阁,甚至“未来世界上第一个只有无人车行驶的城市也许会出现在中国。这样看来,“三年商用、五年量产”的百度无人车计划并非疯狂之举,而是顺理成章。当然,这背后的关键——是人工智能技术的发展和成熟。
深度学习推动人工智能产生质变
人工智能发展已有60年历史,但是业界普遍观点认为在之前的50年,人工智能都没有获得巨大的进步。当最近十年深度学习兴起和发展后,情况变得有些不一样了,它让人工智能获得了发展上的突破,说是“质变”也不为过。
谷歌AlphaGo战胜李世石的例子,可谓是人工智能发展之快的佐证。AlphaGo花了两年多的时间学习了人类的16万个棋局,其中有三千多万步的走法和大量数据,深度学习技术让此前无法想象的浩大工作在如今变得轻松得多。而无人驾驶相比围棋,复杂程度不知道要高出多少个量级,如果没有以深度学习为标志的人工智能技术的长足进步,可以说无人驾驶的发展速度要慢得多。
深度学习用于无人驾驶要有十足底气
深度学习的精髓是让机器模拟人脑来进行学习和思考,其中的关键在于你得给机器足够多的数据、你得能够快速地对数据进行计算和分析、你得让机器越学习越聪明。在全球有意愿投身于深度学习、并且有底气投身于深度学习的公司有三家:谷歌、百度、Facebook。
跟围棋对弈不同,无人驾驶要学习的是如何应对异常复杂的路况、是如何处理和预见临时发生的问题,更重要的在于,围棋失败最多是丢掉棋局,而无人驾驶的失败可能是关乎性命。正因为此,海量数据、超大规模计算、超强算法,缺一不可,而且要求之严苛超乎想象。想在无人车市场搅动风云,没有十足的底气根本不行。谷歌用了两年的时间能让AlphaGo打败全世界最优秀的围棋棋手,但是用了8年时间还无法让无人驾驶打败普通驾驶者,说明无人车难度之高。
百度迎难而上因为有“三大法宝”
而百度迎难而上投身无人驾驶,除了勇气和前瞻性的眼光之外,必须要有技术实力打气。超强计算、海量数据、优秀算法就是百度人工智能的“三大法宝”。
在计算能力方面,百度在无人驾驶深度学习上投入的服务器集群规模是10的6次方,这基于百度在多年技术积累中打造出来的经过考验的计算机体系架构,并非把服务器集中在一起这么简单。据百度高级副总裁王劲介绍,百度已打造的超级计算机Minwa相当于2个天河一号的计算能力,而百度正在设计将整个机房的机器用软件合并成一台服务器,让它们能够共同完成同一件任务,这一计算能力将无与伦比。而且在计算规模上,百度云计算(阳泉)中心在数据存储规模、计算能力和环保节能三方面都处于亚洲一流水平。
在海量数据方面,百度的优势是毋庸置疑的。以中国网民数量来说,几亿网民每天要产生几十亿次的搜索请求,上百亿次的定位请求,百度收录的全网数据已经超过万亿级网页。
在算法上,百度不仅拥有世界级的顶级人才,比如百度首席科学家吴恩达,他是人工智能和机器学习领域国际上最权威的学者之一。另外,百度还拥有全球最大规模的深度神经网络,支持万亿参数、千亿样本、千亿特征训练,作为对比,有公开报道的Digital Reasoning神经网络只有1600亿参数。
人工智能是战略 无人驾驶并非一时之举
除了技术储备之外,百度对人工智能发展的重视程度之高值得我们关注,正因为将人工智能提升到战略高度,因此百度无人驾驶的发展绝对不是短时间顺应市场的一时之举。
对于百度来说,人工智能技术将从战略角度归拢和统一规划百度所有技术体系和产品体系。此前王劲在接受媒体采访的时候曾表示:百度将用人工智能技术重构公司整体技术,包括百度大数据技术、语音技术、图像技术…全部都合并到人工智能技术体系之中。应该说百度未来的技术和百度未来的发展,都会高度依赖人工智能的发展。而无人驾驶,将是百度人工智能发展的“晴雨表”。
好文章,需要你的鼓励
尽管2026年智能手机外观可能变化不大,但内部技术正发生飞跃式进步。AI原生处理器、新型连接技术和先进显示系统正将日常设备转变为具备企业级功能的强大个人平台。这些趋势对企业和消费者同样重要,因为人们携带的手机决定了他们如何访问数据、协作办公、管理工作流程和使用数字服务。
卡内基梅隆大学团队提出DistCA技术,通过分离AI模型中的注意力计算解决长文本训练负载不平衡问题。该技术将计算密集的注意力任务独立调度到专门服务器,配合乒乓执行机制隐藏通信开销,在512个GPU的大规模实验中实现35%的训练加速,为高效长文本AI模型训练提供了新方案。
《时代》杂志宣布AI及其架构师为2025年度人物,包括扎克伯格、苏姿丰、马斯克等八位科技领袖。编辑认为今年是AI全面潜力显现的关键年份,这项技术加速了医学研究和生产力提升,让不可能变为可能。从企业高管到教师学生,所有人都在思考AI对生活的颠覆性影响。
清华大学研究团队提出3DThinker框架,首次让AI具备类似人类的三维空间想象能力。该系统在推理过程中插入特殊的三维想象符号,不依赖外部工具或大量标注数据,就能从有限的二维图像中构建三维心理模型。在多个空间推理基准测试中,3DThinker相比传统方法性能提升达50-100%,为自动驾驶、机器人导航、虚拟现实等领域的AI应用开辟了新路径。