11月11日,火山引擎正式发布豆包编程模型(Doubao-Seed-Code)。该模型专为 Agentic 编程任务深度优化,在多项权威基准测试中达到国内领先水平。同时,豆包编程模型采用分层定价模式与全量透明 Cache 能力,综合使用成本比行业平均水平降低 62.7%。
以创建一个交互式英语学习网站为例,相同tokens使用量下(0-32k输入区间),Claude Sonnet 4.5的使用成本约4.05元,GLM-4.6约为0.77元,而豆包编程模型的使用成本仅需0.34元。
据火山引擎官方介绍,豆包编程模型是国内首个支持视觉理解能力的编程模型,可参照UI设计稿、截图或手绘草图生成代码,或对生成页面进行视觉比对,自主完成样式修复和BUG修复,大幅提升前端开发效率。同时,该模型支持256K长上下文,可以轻松处理长代码文件、多模块依赖等复杂场景,更好地支持端到端自主编程。
豆包编程模型通过大规模Agent强化学习训练,在真实编程场景中效果出色,且展现出良好的泛化能力。与TRAE开发环境深度结合后,豆包编程模型在SWE-Bench Verified榜单中以78.8%的得分达到业界最佳水平,充分验证了模型与工具深度适配后的协同效应。

图:豆包编程模型在多项权威基准测试中达到国内领先水平
目前,豆包编程模型已通过火山方舟平台开放 API,并已接入TRAE 中国版。正值双十一购物季,火山引擎为个人开发者量身打造了“Coding Plan”优惠套餐,首月最低9.9元。该套餐支持 Claude Code,以及veCLI、Cursor、Cline、Codex CLI等主流工具环境,更借助火山方舟超大资源池,为开发者提供稳定畅快的编程体验,加速推动大模型普惠和AI应用创新。
好文章,需要你的鼓励
尽管全球企业AI投资在2024年达到2523亿美元,但MIT研究显示95%的企业仍未从生成式AI投资中获得回报。专家预测2026年将成为转折点,企业将从试点阶段转向实际部署。关键在于CEO精准识别高影响领域,推进AI代理技术应用,并加强员工AI能力培训。Forrester预测30%大型企业将实施强制AI培训,而Gartner预计到2028年15%日常工作决策将由AI自主完成。
这项由北京大学等机构联合完成的研究,开发了名为GraphLocator的智能软件问题诊断系统,通过构建代码依赖图和因果问题图,能够像医生诊断疾病一样精确定位软件问题的根源。在三个大型数据集的测试中,该系统比现有方法平均提高了19.49%的召回率和11.89%的精确率,特别在处理复杂的跨模块问题时表现优异,为软件维护效率的提升开辟了新路径。
2026年软件行业将迎来定价模式的根本性变革,从传统按席位收费转向基于结果的付费模式。AI正在重塑整个软件经济学,企业IT预算的12-15%已投入AI领域。这一转变要求建立明确的成功衡量指标,如Zendesk以"自动化解决方案"为标准。未来将出现更精简的工程团队,80%的工程师需要为AI驱动的角色提升技能,同时需要重新设计软件开发和部署流程以适应AI优先的工作流程。
这项由德国达姆施塔特工业大学领导的国际研究团队首次发现,当前最先进的专家混合模型AI系统存在严重安全漏洞。通过开发GateBreaker攻击框架,研究人员证明仅需关闭约3%的特定神经元,就能让AI的攻击成功率从7.4%暴增至64.9%。该研究揭示了专家混合模型安全机制过度集中的根本缺陷,为AI安全领域敲响了警钟。