让AI更稳定、更会追问：千问C端应用团队ICLR 2026连中四篇论文

当AI助手越来越多地参与到学习、工作辅助、医疗咨询等生活场景，能否稳定输出、是否懂得追问关键信息，正成为衡量AI能力的重要标准。

1月30日消息，千问C端应用团队的四篇人工智能领域研究论文入选2026国际学习表征会议（ICLR 2026），论文聚焦扩散模型训练、多轮对话决策、信息验证及模型价值观对齐等关键问题，部分成果已有实际应用，推动AI助手在复杂场景下更加聪明、可靠、实用。

ICLR与NeurIPS、ICML并称为机器学习和人工智能领域三大顶级国际会议。本届会议投稿量接近19000篇，接收率创下近年来新低。

本次四篇论文在多个前沿领域取得创新突破。在扩散语言模型（Diffusion Models）研究方面，千问C端应用团队针对dLLM独特的掩码训练不稳定性，将其系统分解为了三种不同的噪声来源，并相应提出帕累托最优的无偏训练算法。该算法显著降低了dLLM的训练波动、进而提升其图文生成质量。这意味着在内容生成、创作辅助等应用中，AI输出将更加稳定。

围绕医疗多轮对话中的复杂推理任务，团队提出了自适应树策略优化（ATPO）方法，使AI能够根据对话中的不确定性动态调整决策路径。当信息不足时，AI会主动追问关键问题；当线索清晰时，则快速给出判断。这一能力可帮助AI助手在医疗咨询等专业场景学会“主动问诊”，让AI像经验丰富的医生一样，只问最关键的问题，避免无用的来回对话。

在信息检索与验证方面，研究团队构建了“提问—解答—验证”的自博弈强化学习框架，使AI在无需人工标注的情况下不断自我验证与进化。这一机制有助于提升AI在复杂问题下的检索与核验能力，在学习辅助、研究支持等知识密集型场景中表现更为可靠。

此外，在模型价值观对齐研究中，团队引入信息论偏见消除方法，引导奖励模型关注真正与人类偏好相关的信号，减少冗长、格式化但信息密度不高的输出。这使得AI在训练过程中真正关注能够帮助到用户的核心要点，降低模型输出中出现“表面迎合但缺乏实质内容价值”的情况。

业内专家指出，当前大模型竞争正从“参数规模”转向“算法深度与工程实效”。千问C端应用团队在生成稳定性、多轮对话决策和模型对齐等方向上的系统性探索，体现了其在基础算法与应用导向研究上的持续投入。

值得一提的是，此次千问C端应用团队入选 ICLR 2026 的四篇论文相关代码均已开源。通过开放核心实现细节，将为行业在提升AI可用性、可靠性方面提供有益参考。

来源：业界供稿

0赞

好文章，需要你的鼓励

让AI更稳定、更会追问：千问C端应用团队ICLR 2026连中四篇论文

来源：业界供稿

2026

01/30

20:42

分享

点赞

Uber年度遗失物报告揭示：数千件物品遗留在无人驾驶出租车中

Uber今年将部署500辆数据采集车辆，助力自动驾驶发展

Uber、Wayve与Waymo的伦敦无人驾驶出租车大战即将开启

Mobileye计划2027年在美国推出自动驾驶出租车服务

Waymo召回近4000辆无人出租车，原因是其进入高速公路施工区域

特斯拉在奥斯汀开始测试无方向盘无踏板Cybercab量产版

图灵奖得主Patterson：摩尔定律的真相，CPU、GPU、TPU的诞生与分工

Omdia报告：Dell PowerProtect助力企业三年期网络弹性TCO最高降低61%

“驯服”千亿模型，鏖战“黑猴打瓦”，龙虾“一键接管” ，锐龙AI Max+ 395开启全能桌面AI主机“王炸”时刻

豪声电子泰国电声工厂初步投产：2500万泰铢项目进入产能爬坡

地瓜机器人将560TOPS端侧算力，加载到了20+头部团队机器人中

WAIC 2026主论坛（下午场）重磅揭晓！

阿里AI芯片露真容，“通云哥”黄金三角浮出水面

阿里云发布多模态交互开发套件，让硬件能听、会看、会交互

MaaS市场权威报告：阿里云获5项最高评级，为中国第一

押注AI智能体，奇奇科技跨越十年的“换挡”与远航

NBA中国与阿里云宣布达成多年合作，重塑球迷互动体验

SAPx阿里云，开启一条通往中国市场与全球化发展的全新路径

阿里要用AI将云计算重做一遍

阿里吴泳铭最新演讲：实现超级人工智能ASI的三个阶段

2025云栖大会剧透来了！今年有哪些AI新看点？

钉钉十年，无招终于等来了AI这把“锤子”

如果您非常迫切的想了解IT领域最新产品与技术信息，那么订阅至顶网技术邮件将是您的最佳途径之一

三一集团：数字化是必选项，AI是生存项

因湃电池 × 达索系统：如何共创出一套电池产业最佳实践

AI走进真实世界之后：安全、健康与产业的新命题

CES 2026

关注官方公众号

关注官方微博

关注官方喜马拉雅

友情链接

业界热点: