11月11日,火山引擎正式发布豆包编程模型(Doubao-Seed-Code)。该模型专为 Agentic 编程任务深度优化,在多项权威基准测试中达到国内领先水平。同时,豆包编程模型采用分层定价模式与全量透明 Cache 能力,综合使用成本比行业平均水平降低 62.7%。
以创建一个交互式英语学习网站为例,相同tokens使用量下(0-32k输入区间),Claude Sonnet 4.5的使用成本约4.05元,GLM-4.6约为0.77元,而豆包编程模型的使用成本仅需0.34元。
据火山引擎官方介绍,豆包编程模型是国内首个支持视觉理解能力的编程模型,可参照UI设计稿、截图或手绘草图生成代码,或对生成页面进行视觉比对,自主完成样式修复和BUG修复,大幅提升前端开发效率。同时,该模型支持256K长上下文,可以轻松处理长代码文件、多模块依赖等复杂场景,更好地支持端到端自主编程。
豆包编程模型通过大规模Agent强化学习训练,在真实编程场景中效果出色,且展现出良好的泛化能力。与TRAE开发环境深度结合后,豆包编程模型在SWE-Bench Verified榜单中以78.8%的得分达到业界最佳水平,充分验证了模型与工具深度适配后的协同效应。

图:豆包编程模型在多项权威基准测试中达到国内领先水平
目前,豆包编程模型已通过火山方舟平台开放 API,并已接入TRAE 中国版。正值双十一购物季,火山引擎为个人开发者量身打造了“Coding Plan”优惠套餐,首月最低9.9元。该套餐支持 Claude Code,以及veCLI、Cursor、Cline、Codex CLI等主流工具环境,更借助火山方舟超大资源池,为开发者提供稳定畅快的编程体验,加速推动大模型普惠和AI应用创新。
好文章,需要你的鼓励
快手科技研究团队提出了熵比截断机制,用于解决强化学习训练中AI容易"走偏"的问题。该方法通过监控AI学习前后思维活跃度变化,在关键时刻进行精准干预,既保证训练稳定性又维持探索能力。在数学推理任务中,此方法显著提升了模型性能并改善了训练稳定性,为AI训练领域提供了新的解决思路。
AI重构全球商业逻辑的当下,中国科技服务商如何跨越“被边缘化”的焦虑,在“云+AI”的全球版图中寻找新坐标?
EditThinker是北京航空航天大学与美团等机构联合研发的图像编辑AI框架,让AI在编辑图片时能够像人类一样进行反复思考和优化。该系统通过"批评-优化-重试"的循环机制,将传统的一次性编辑转变为迭代改进过程,在四个权威测试平台上显著提升了现有编辑模型的表现,特别是在需要复杂推理的编辑任务中效果突出。