11月11日,火山引擎正式发布豆包编程模型(Doubao-Seed-Code)。该模型专为 Agentic 编程任务深度优化,在多项权威基准测试中达到国内领先水平。同时,豆包编程模型采用分层定价模式与全量透明 Cache 能力,综合使用成本比行业平均水平降低 62.7%。
以创建一个交互式英语学习网站为例,相同tokens使用量下(0-32k输入区间),Claude Sonnet 4.5的使用成本约4.05元,GLM-4.6约为0.77元,而豆包编程模型的使用成本仅需0.34元。
据火山引擎官方介绍,豆包编程模型是国内首个支持视觉理解能力的编程模型,可参照UI设计稿、截图或手绘草图生成代码,或对生成页面进行视觉比对,自主完成样式修复和BUG修复,大幅提升前端开发效率。同时,该模型支持256K长上下文,可以轻松处理长代码文件、多模块依赖等复杂场景,更好地支持端到端自主编程。
豆包编程模型通过大规模Agent强化学习训练,在真实编程场景中效果出色,且展现出良好的泛化能力。与TRAE开发环境深度结合后,豆包编程模型在SWE-Bench Verified榜单中以78.8%的得分达到业界最佳水平,充分验证了模型与工具深度适配后的协同效应。

图:豆包编程模型在多项权威基准测试中达到国内领先水平
目前,豆包编程模型已通过火山方舟平台开放 API,并已接入TRAE 中国版。正值双十一购物季,火山引擎为个人开发者量身打造了“Coding Plan”优惠套餐,首月最低9.9元。该套餐支持 Claude Code,以及veCLI、Cursor、Cline、Codex CLI等主流工具环境,更借助火山方舟超大资源池,为开发者提供稳定畅快的编程体验,加速推动大模型普惠和AI应用创新。
好文章,需要你的鼓励
今天讲的出海案例是明阳电气,这家输配电设备公司在马来西亚投产首个海外生产基地,并以 250 万林吉特子公司承接本地制造。
研究揭示AI搜索代理"屏蔽旧观测"策略的效果取决于检索质量与模型能力的匹配程度,存在三种截然不同的效果区间。
数学界发布《莱顿宣言》,由16位研究人员历时8个月起草,已获国际数学联盟背书。宣言指出,AI正威胁数学研究的核心价值:AI生成的错误证明难以识别、论文引用不规范、版权争议频发、科技公司主导研究议题,以及企业借新闻稿抢占话语权等问题日益严峻。宣言呼吁数学家透明披露AI使用情况,建议监管机构保护作者权利并规范AI产业,同时警告各方不要轻信科技公司对AI能力的夸大宣传。
多所高校与研究机构联合构建机器人语义接地测试平台RSB,发现主流VLA模型普遍存在"能抓但抓错"的致命缺陷,语义理解与动作生成之间存在严重断层。