随着AI系统从独立模型向自主、代理式系统转型,对信任、透明度和风险感知设计的需求从未如此迫切。这些由大语言模型(LLM)和多代理编排技术驱动的智能代理,正越来越多地做出影响企业、个人及整个社会的决策。然而,我们不能假定这些系统的可信度:它必须在系统层面进行设计、测量和持续强化,而不仅仅是模型层面。
AI可信度的关键驱动力之一是模型供应链透明度——一个允许企业评估和验证复杂系统中使用的AI组件的来源、安全性和一致性的框架。如果无法清晰了解AI模型是如何构建、训练和部署的,就几乎不可能对系统需求进行风险分析。本文探讨了模型供应链透明度为何至关重要,它如何支持代理式AI中的风险对齐,以及设计可信AI生态系统的最佳实践。
AI供应链日益增长的复杂性
现代AI系统不再是一个单一体,而是由多个相互关联的模型、API和组件(包括外部数据源和工具)组成。这种复杂性引入了新的风险因素,包括:
这些挑战凸显了模型供应链透明度的重要性。这就是为什么行业需要标准化AI供应链可见性,确保模型在构建时考虑了问责制和风险对齐。
为什么风险分析对代理式AI至关重要
与传统AI模型按要求提供输出不同,代理式AI系统基于高级目标自主行动。这种从反应式到主动式AI的转变要求新的风险评估方法。部署多代理编排和函数调用框架的企业必须评估:
风险对齐的AI系统不仅简单地执行功能——它理解自己的局限性,沟通不确定性,并在必要时允许人类监督。
提升AI系统可信度的最佳实践
为确保AI系统可信,企业必须在AI生命周期的每个阶段嵌入安全措施。以下最佳实践可提供帮助:
通过整合这些实践,企业可以主动设计信任机制,而非在部署后补救安全功能。从已建立的实施模式来看(例如ThoughtWorks的Martin Fowler和Bharani Subramaniam的《构建生成式AI产品的新兴模式》),在未来几年中,将信任设计元素融入其中并采用相关最佳实践,对于在企业规模成功部署AI而言,将会变得愈发重要。
结论:信任是系统级重要任务
随着AI从模型向系统过渡,企业必须采用整体方法来处理信任和透明度。这需要:
归根结底,信任不是功能,而是基础。为了确保AI系统安全、有效并与人类价值观对齐,我们必须在每个层面为信任展开设计——从数据和模型到决策和部署。
好文章,需要你的鼓励
AI颠覆预计将在2026年持续,推动企业适应不断演进的技术并扩大规模。国际奥委会、Moderna和Sportradar的领导者在纽约路透社峰会上分享了他们的AI策略。讨论焦点包括自建AI与购买第三方资源的选择,AI在内部流程优化和外部产品开发中的应用,以及小型模型在日常应用中的潜力。专家建议,企业应将AI建设融入企业文化,以创新而非成本节约为驱动力。
字节跳动等机构联合发布GAR技术,让AI能同时理解图像的全局和局部信息,实现对多个区域间复杂关系的准确分析。该技术通过RoI对齐特征重放方法,在保持全局视野的同时提取精确细节,在多项测试中表现出色,甚至在某些指标上超越了体积更大的模型,为AI视觉理解能力带来重要突破。
Spotify在新西兰测试推出AI提示播放列表功能,用户可通过文字描述需求让AI根据指令和听歌历史生成个性化播放列表。该功能允许用户设置定期刷新,相当于创建可控制算法的每周发现播放列表。这是Spotify赋予用户更多控制权努力的一部分,此前其AI DJ功能也增加了语音提示选项,反映了各平台让用户更好控制算法推荐的趋势。
Inclusion AI团队推出首个开源万亿参数思维模型Ring-1T,通过IcePop、C3PO++和ASystem三项核心技术突破,解决了超大规模强化学习训练的稳定性和效率难题。该模型在AIME-2025获得93.4分,IMO-2025达到银牌水平,CodeForces获得2088分,展现出卓越的数学推理和编程能力,为AI推理能力发展树立了新的里程碑。