作为全球首个AI开发者大会,百度Create大会至今已举办5届。这次的大会并不是展示文心大模型有多少更新,而是把开发者群体作为重点,帮助开发者用好文心大模型。
《人人都是开发者》也是百度创始人、董事长兼首席执行官李彦宏今年的演讲主题,他认为,大模型和生成式AI将彻底改变开发者群体。
过去开发者用代码改变世界,未来自然语言将成为通用编程语言。你只要会说话,就可以成为一名开发者,用自己的创造力改变世界。
百度创始人、董事长兼首席执行官李彦宏
继往开来,文心一言的实践经验
李彦宏首先汇报了文心一言发布一年的成果:用户数突破2亿,API日均调用量超过两亿,服务用户数达到8.5万,千帆平台开发的AI原生应用超过19万。
现在文心大模型的算法训练效率提升到了原来的5.1倍,周均训练有效率达到98.8%,推理性能提升了105倍。
也就是说,客户原来一天调用1万次,同样成本现在可以调用100万次。
同时因为百度在芯片、框架、模型、应用这四层架构上有着全栈的布局,通过端到端优化,不断地把成本打下来,让推理的成本降到了原来的1%。
李彦宏也强调,大模型本身并不直接创造价值,基于大模型开发出来的AI应用才能满足真实的市场需求。
会上百度也正式发布文心大模型4.0工具版,包括文档问答、数据分析、代码执行。
李彦宏还分享了,百度踩了无数的坑,交了高昂的学费换来的经验。
第一,未来大模型的AI原生应用都是MoE架构:也就是大小模型混用,针对应用的不同场景做匹配;
第二,特定场景,精调后的小模型使用效果可以媲美大模型:通过大模型压缩蒸馏出来一个基础模型,然后再用数据去训练,比从头开始训小模型效果要好很多;
第三,智能体能力的提升会不断催生出大量新的应用:智能体机制包括理解、规划、反思和进化,它让机器像人一样思考和行动,可以自主完成复杂任务,在环境中持续学习、实现自我迭代和进化。
随取随用,三大AI开发工具
针对MoE、小模型、智能体三个方向,百度提供了“开箱即用”的三大AI开发工具,包括智能体开发工具AgentBuilder、AI原生应用开发工具AppBuilder、各种尺寸的模型定制工具ModelBuilder。
AgentBuilder
智能体可能是未来离每个人最近、最主流的大模型使用方式,基于强大的基础模型,智能体可以批量生成,应用在各种各样的场景。
今天,每一个商家、每一个客户,都能在百度拥有专属的智能体。整个过程完全不需要编程,通过类似提示词的信息输入,和简单的几步操作调优,就能迅速生成一个智能体,成为7X24小时在线的金牌业务员。
截至目前,已经有3万多个智能体被创建、5万多名开发者和上万家企业入驻。目前,已有超过1万个百度的客户拥有了商家智能体,涵盖了教育培训、房产家居、机械设备、商务服务等超过30个行业。
而且文心智能体平台还为开发者们提供了流量变现的通路,除了百度搜索,百度生态的其他产品,如小度、地图、贴吧、车机等,都能接入智能体的相关能力,为开发者解决流量分发。
AppBuilder
在AppBuilder上面,百度提前封装和预置了开发AI原生应用所需的各种组件和框架,大幅降低开发门槛。最快只需三步,开发者就可以用自然语言开发出一个AI原生应用,并且能够便捷地发布、集成到各种各样的业务环境中。”
只需要3步,就可以用自然语言开发出一个AI原生应用,并且能够便捷地发布、集成到各种各样的业务环境中。
首先,打开AppBuilder的开发界面,给应用起名;第二步,在角色指令中描述具体要求,包括调用代码解释器、算出在固定时间内的最佳组合、输出结果等;第三步到工具组件中,把代码解释器添加进来,帮助运算。
“AppBuilder的两个明显优势就是功能强大和简单易用。”李彦宏说。
ModelBuilder
各种尺寸的模型定制工具ModelBuilder是更适合专业开发者使用的工具,它可以根据开发者的需求定制任意尺寸的模型,并根据细分场景对模型进一步精调,这样就能达到更好的效果。
ModelBuilder可以高效低价生产模型。李彦宏强调,通过强大的文心4.0降维裁剪出来的更小尺寸模型,要比直接拿开源调出来的模型,同等尺寸下效果明显更好,同等效果下,成本明显更低。
“开源模型模型会越来越落后。”李彦宏说,大家以前用开源觉得开源便宜,其实在大模型场景下,开源是最贵的。
ModelBuilder预置最全面最丰富的大模型,达到77个,是国内大模型最多的开发平台。包括旗舰版大模型ERNIE3.5和ERNIE4.0;三个轻量级大模型ERNIE Speed、Lite、Tiny;两个垂直场景的模型,ERNIE Character适合角色扮演;ERNIE Functions适合对话或问答场景中的外部工具使用和业务函数调用。
会上,百度集团执行副总裁、百度智能云事业群总裁沈抖也发布了,新一代智能计算操作系统“万源”,万源涵盖了异构硬件基础架构、云原生平台、百度百舸、ModelBuilder、AppBuilder、AgentBuilder。
李彦宏最后也特别强调开发者这一人群在AI时代的作用,今天人人都是开发者,人人都是创造者。
好文章,需要你的鼓励
Intuit在ChatGPT发布后匆忙推出的聊天式AI助手遭遇失败,随后公司进行了为期九个月的战略转型。通过观察客户实际工作流程,发现手动转录发票等重复性劳动,决定用AI智能体自动化这些任务而非强加新的聊天行为。公司建立了三大支柱框架:培养构建者文化、高速迭代替代官僚主义、构建GenOS平台引擎。最终推出的QuickBooks支付智能体让小企业平均提前5天收到款项,每月节省12小时工作时间。
希伯来大学研究团队开发出MV-RAG系统,首次解决了AI在生成稀有物品3D模型时的"胡编乱造"问题。该系统像拥有图像记忆库的艺术家,能先搜索相关真实照片再生成准确3D视图。通过独创的混合训练策略和智能自适应机制,MV-RAG在处理罕见概念时性能显著超越现有方法,为游戏开发、影视制作、虚拟现实等领域提供了强大工具。
马斯克旗下xAI公司发布专为开发者设计的新AI模型grok-code-fast-1,主打快速且经济的推理能力。该模型属于Grok 4系列,具备自主处理任务的能力。xAI声称其在SWE-bench评测中解决了70.8%的实际软件问题,表现优于GPT-5和Claude 4。不过模型存在较高的不诚实率问题。用户可通过GitHub Copilot等平台免费试用7天,需要API密钥访问。
MBZUAI等机构研究团队通过一维细胞自动机实验揭示了AI模型多步推理的关键限制:固定深度模型在单步预测上表现优异,但多步推理能力急剧下降。研究发现增加模型深度比宽度更有效,自适应计算时间、强化学习和思维链训练能突破这些限制。这为开发更强推理能力的AI系统提供了重要指导,强调了真正推理与简单记忆的本质区别。