11月11日,火山引擎正式发布豆包编程模型(Doubao-Seed-Code)。该模型专为 Agentic 编程任务深度优化,在多项权威基准测试中达到国内领先水平。同时,豆包编程模型采用分层定价模式与全量透明 Cache 能力,综合使用成本比行业平均水平降低 62.7%。
以创建一个交互式英语学习网站为例,相同tokens使用量下(0-32k输入区间),Claude Sonnet 4.5的使用成本约4.05元,GLM-4.6约为0.77元,而豆包编程模型的使用成本仅需0.34元。
据火山引擎官方介绍,豆包编程模型是国内首个支持视觉理解能力的编程模型,可参照UI设计稿、截图或手绘草图生成代码,或对生成页面进行视觉比对,自主完成样式修复和BUG修复,大幅提升前端开发效率。同时,该模型支持256K长上下文,可以轻松处理长代码文件、多模块依赖等复杂场景,更好地支持端到端自主编程。
豆包编程模型通过大规模Agent强化学习训练,在真实编程场景中效果出色,且展现出良好的泛化能力。与TRAE开发环境深度结合后,豆包编程模型在SWE-Bench Verified榜单中以78.8%的得分达到业界最佳水平,充分验证了模型与工具深度适配后的协同效应。

图:豆包编程模型在多项权威基准测试中达到国内领先水平
目前,豆包编程模型已通过火山方舟平台开放 API,并已接入TRAE 中国版。正值双十一购物季,火山引擎为个人开发者量身打造了“Coding Plan”优惠套餐,首月最低9.9元。该套餐支持 Claude Code,以及veCLI、Cursor、Cline、Codex CLI等主流工具环境,更借助火山方舟超大资源池,为开发者提供稳定畅快的编程体验,加速推动大模型普惠和AI应用创新。
好文章,需要你的鼓励
牛津大学提出PHYSIFORMER,一种扩散变换器模型,通过三维网格顶点轨迹直接在世界坐标空间预测刚性与弹性物体的物理运动,一次性生成全序列轨迹,超越自回归基线。
随着医疗数据数字化与互操作性的进步,跨机构纵向患者数据的研究应用成为可能。本研究通过对20位领域专家的访谈,识别出8种数据收集方法,涵盖智能手机应用、结构化数据导出、区域/全国研究查询及聚合数据源等。研究发现,各方法均有其优缺点,无单一最优方案。参与者中介交换方式可绕过复杂治理安排,但存在数据缺口;全国性网络尚不支持研究查询。公共政策的持续推进将对该领域发展起关键作用。
研究发现主流奖励模型对同等质量答案给出差异悬殊的分数,并提出"奖励聚类"算法通过蒙特卡洛随机失活将连续分数离散化,在不重训模型的前提下有效减少AI训练中的奖励作弊现象。