作为全球首个AI开发者大会,百度Create大会至今已举办5届。这次的大会并不是展示文心大模型有多少更新,而是把开发者群体作为重点,帮助开发者用好文心大模型。
《人人都是开发者》也是百度创始人、董事长兼首席执行官李彦宏今年的演讲主题,他认为,大模型和生成式AI将彻底改变开发者群体。
过去开发者用代码改变世界,未来自然语言将成为通用编程语言。你只要会说话,就可以成为一名开发者,用自己的创造力改变世界。
百度创始人、董事长兼首席执行官李彦宏
继往开来,文心一言的实践经验
李彦宏首先汇报了文心一言发布一年的成果:用户数突破2亿,API日均调用量超过两亿,服务用户数达到8.5万,千帆平台开发的AI原生应用超过19万。
现在文心大模型的算法训练效率提升到了原来的5.1倍,周均训练有效率达到98.8%,推理性能提升了105倍。
也就是说,客户原来一天调用1万次,同样成本现在可以调用100万次。
同时因为百度在芯片、框架、模型、应用这四层架构上有着全栈的布局,通过端到端优化,不断地把成本打下来,让推理的成本降到了原来的1%。
李彦宏也强调,大模型本身并不直接创造价值,基于大模型开发出来的AI应用才能满足真实的市场需求。
会上百度也正式发布文心大模型4.0工具版,包括文档问答、数据分析、代码执行。
李彦宏还分享了,百度踩了无数的坑,交了高昂的学费换来的经验。
第一,未来大模型的AI原生应用都是MoE架构:也就是大小模型混用,针对应用的不同场景做匹配;
第二,特定场景,精调后的小模型使用效果可以媲美大模型:通过大模型压缩蒸馏出来一个基础模型,然后再用数据去训练,比从头开始训小模型效果要好很多;
第三,智能体能力的提升会不断催生出大量新的应用:智能体机制包括理解、规划、反思和进化,它让机器像人一样思考和行动,可以自主完成复杂任务,在环境中持续学习、实现自我迭代和进化。
随取随用,三大AI开发工具
针对MoE、小模型、智能体三个方向,百度提供了“开箱即用”的三大AI开发工具,包括智能体开发工具AgentBuilder、AI原生应用开发工具AppBuilder、各种尺寸的模型定制工具ModelBuilder。
AgentBuilder
智能体可能是未来离每个人最近、最主流的大模型使用方式,基于强大的基础模型,智能体可以批量生成,应用在各种各样的场景。
今天,每一个商家、每一个客户,都能在百度拥有专属的智能体。整个过程完全不需要编程,通过类似提示词的信息输入,和简单的几步操作调优,就能迅速生成一个智能体,成为7X24小时在线的金牌业务员。
截至目前,已经有3万多个智能体被创建、5万多名开发者和上万家企业入驻。目前,已有超过1万个百度的客户拥有了商家智能体,涵盖了教育培训、房产家居、机械设备、商务服务等超过30个行业。
而且文心智能体平台还为开发者们提供了流量变现的通路,除了百度搜索,百度生态的其他产品,如小度、地图、贴吧、车机等,都能接入智能体的相关能力,为开发者解决流量分发。
AppBuilder
在AppBuilder上面,百度提前封装和预置了开发AI原生应用所需的各种组件和框架,大幅降低开发门槛。最快只需三步,开发者就可以用自然语言开发出一个AI原生应用,并且能够便捷地发布、集成到各种各样的业务环境中。”
只需要3步,就可以用自然语言开发出一个AI原生应用,并且能够便捷地发布、集成到各种各样的业务环境中。
首先,打开AppBuilder的开发界面,给应用起名;第二步,在角色指令中描述具体要求,包括调用代码解释器、算出在固定时间内的最佳组合、输出结果等;第三步到工具组件中,把代码解释器添加进来,帮助运算。
“AppBuilder的两个明显优势就是功能强大和简单易用。”李彦宏说。
ModelBuilder
各种尺寸的模型定制工具ModelBuilder是更适合专业开发者使用的工具,它可以根据开发者的需求定制任意尺寸的模型,并根据细分场景对模型进一步精调,这样就能达到更好的效果。
ModelBuilder可以高效低价生产模型。李彦宏强调,通过强大的文心4.0降维裁剪出来的更小尺寸模型,要比直接拿开源调出来的模型,同等尺寸下效果明显更好,同等效果下,成本明显更低。
“开源模型模型会越来越落后。”李彦宏说,大家以前用开源觉得开源便宜,其实在大模型场景下,开源是最贵的。
ModelBuilder预置最全面最丰富的大模型,达到77个,是国内大模型最多的开发平台。包括旗舰版大模型ERNIE3.5和ERNIE4.0;三个轻量级大模型ERNIE Speed、Lite、Tiny;两个垂直场景的模型,ERNIE Character适合角色扮演;ERNIE Functions适合对话或问答场景中的外部工具使用和业务函数调用。
会上,百度集团执行副总裁、百度智能云事业群总裁沈抖也发布了,新一代智能计算操作系统“万源”,万源涵盖了异构硬件基础架构、云原生平台、百度百舸、ModelBuilder、AppBuilder、AgentBuilder。
李彦宏最后也特别强调开发者这一人群在AI时代的作用,今天人人都是开发者,人人都是创造者。
好文章,需要你的鼓励
Anthropic发布SCONE-bench智能合约漏洞利用基准测试,评估AI代理发现和利用区块链智能合约缺陷的能力。研究显示Claude Opus 4.5等模型可从漏洞中获得460万美元收益。测试2849个合约仅需3476美元成本,发现两个零日漏洞并创造3694美元利润。研究表明AI代理利用安全漏洞的能力快速提升,每1.3个月翻倍增长,强调需要主动采用AI防御技术应对AI攻击威胁。
NVIDIA联合多所高校开发的SpaceTools系统通过双重交互强化学习方法,让AI学会协调使用多种视觉工具进行复杂空间推理。该系统在空间理解基准测试中达到最先进性能,并在真实机器人操作中实现86%成功率,代表了AI从单一功能向工具协调专家的重要转变,为未来更智能实用的AI助手奠定基础。
Spotify年度总结功能回归,在去年AI播客功能遭遇批评后,今年重新专注于用户数据深度分析。新版本引入近十项新功能,包括首个实时多人互动体验"Wrapped Party",最多可邀请9位好友比较听歌数据。此外还新增热门歌曲播放次数显示、互动歌曲测验、听歌年龄分析和听歌俱乐部等功能,让年度总结更具互动性和个性化体验。
这项研究解决了现代智能机器人面临的"行动不稳定"问题,开发出名为TACO的决策优化系统。该系统让机器人在执行任务前生成多个候选方案,然后通过伪计数估计器选择最可靠的行动,就像为机器人配备智能顾问。实验显示,真实环境中机器人成功率平均提升16%,且系统可即插即用无需重新训练,为机器人智能化发展提供了新思路。