ZD至顶网软件频道消息: 2016百度世界大会上,百度首席科学家吴恩达首次宣布对外开放百度深度学习平台,为程序开发者提供一个功能更全、效果更好的深度学习框架。一直以来,百度非常重视对于开源软件的使用,同时也愿意把内部的技术以开源的形式贡献出来,和开源社区的开发者们进行广泛的合作。
近日,在中关村创业大街车库咖啡,百度开发者中心举办了第67期技术沙龙,本期技术沙龙是“百度开源专场”,来自百度的两位资深研发工程师结合具体的产品案例,分享百度开源技术最新实践经验。
来自百度深度学习平台的工程师于洋首先和大家分享了百度开源的最新项目:百度深度学习平台。以手写和情感分类任务为例,从什么是百度深度学习平台,再到百度深度学习平台整体架构,以及整体架构的构成是如何实现全链接,于洋现场分享了百度深度学习平台的实现特点和机制。于洋表示,百度深度学习平台是一个性能优先、灵活易用的平台,是一个务实的平台,是一个已经解决和将要解决一些实际问题的平台。目前,百度深度学习系统已经应用到了超过30个主要产品中。
百度搜索基础架构负责人颜世光在此次沙龙会上,主要针对百度当前的搜索引擎,以及搜索引擎背后的事件做了精彩纷呈的演讲。当前,互联网上内容的规模增长到万亿量级, 而用户对搜索引擎收录速度的期望却越来越高。之前几百亿的数据,我们可以用几周时间处理,而现在几万亿的数据,要实时地处理所有更新。颜世光表示,百度新一代搜索基础架构的最大特点是针对海量的目标数据,进行实时、增量地处理,提升处理速度的同时节省了成本。
此次沙龙也特意安排了现场QA环节,每位主讲人讲完之后,许多观众纷纷地抓住机会与嘉宾进行了现场互动,与主讲人们一起探讨百度开源的技术以及实现的意义,两位嘉宾的精彩作答也是让在场的观众受益匪浅。
据了解,百度技术沙龙是由百度开发者中心主办,InfoQ负责策划、组织、实施的线下技术交流活动,每月1期,旨在为中高端技术人员提供一个自由的技术交流和分享的平台。百度技术沙龙通过向开发者共享百度核心技术、数据和资源,为开发者提供全方位服务和支持。作为国内互联网巨头,百度开发者中心是百度扶持行业发展、创造共赢生态的一面窗口。
好文章,需要你的鼓励
亚马逊云服务部门与OpenAI签署了一项价值380亿美元的七年协议,为ChatGPT制造商提供数十万块英伟达图形处理单元。这标志着OpenAI从研究实验室向AI行业巨头的转型,该公司已承诺投入1.4万亿美元用于基础设施建设。对于在AI时代竞争中处于劣势的亚马逊而言,这项协议证明了其构建和运营大规模数据中心网络的能力。
Meta FAIR团队发布的CWM是首个将"世界模型"概念引入代码生成的32亿参数开源模型。与传统只学习静态代码的AI不同,CWM通过学习Python执行轨迹和Docker环境交互,真正理解代码运行过程。在SWE-bench等重要测试中表现卓越,为AI编程助手的发展开辟了新方向。
当今最大的AI数据中心耗电量相当于一座小城市。美国数据中心已占全国总电力消费的4%,预计到2028年将升至12%。电力供应已成为数据中心发展的主要制约因素。核能以其清洁、全天候供电特性成为数据中心运营商的新选择。核能项目供应链复杂,需要创新的采购模式、标准化设计、早期参与和数字化工具来确保按时交付。
卡内基梅隆大学研究团队发现AI训练中的"繁荣-崩溃"现象,揭示陈旧数据蕴含丰富信息但被传统方法错误屏蔽。他们提出M2PO方法,通过改进数据筛选策略,使模型即使用256步前的陈旧数据也能达到最新数据的训练效果,准确率最高提升11.2%,为大规模异步AI训练开辟新途径。