蚂蚁数科提出创新跨域微调框架ScaleOT入选全球AI顶会AAAI 2025

模型性能无损，隐私保护效果提升50%。

在具体业务场景中应用大模型时，模型微调是关键步骤。然而，传统微调方法面临两难：将数据上传给模型方，可能会引发数据隐私和安全风险；而将完整模型交给数据方则可能会导致模型知识产权泄漏，并增加微调模型遭受攻击的风险。

近日，在全球人工智能顶级学术会议AAAI 2025期间，由蚂蚁数科、浙江大学、利物浦大学和华东师范大学联合团队提出了一种创新的跨域微调（offsite-tuning）框架——ScaleOT，该框架可实现在模型性能无损的前提下，将隐私保护效果提升50%。与知识蒸馏技术相比，Scale OT显著降低了90%的算力消耗，为百亿级参数模型的跨域微调提供了一种高效、轻量化的解决方案。这篇论文以其创新性入选了全球AI顶会AAAI的oral论文。据了解，本届AAAI大会共收到近13000篇论文，被选中做口头报告的论文比例仅4.6%。

为同时保护模型产权与数据隐私，目前业内采用的主流方案是"跨域微调"。跨域微调是一种大模型隐私保护训练方法，它通过有损压缩技术将大模型转换为仿真器(Emulator)，数据持有方基于仿真器训练适配器（Adapter)并返回给大模型，从而完成调优。在此过程中，由于数据和模型均未出域，该方法同时保护了模型方与数据方的隐私。然而跨域微调往往需要牺牲模型的性能或者付出高昂算力成本。

当前主流的跨域微调方法存在显著局限性：其一，其“均匀抽积木”式的处理方式容易造成模型关键层的缺失，从而导致模型性能显著下降；其二，若采用蒸馏技术来弥补性能损失，计算成本几乎与重新训练一个中型模型相当。此外，现有方法在隐私保护方面缺乏灵活性，难以根据不同场景需求动态调整隐私保护强度。

据蚂蚁数科技术团队介绍，ScaleOT提出了三大创新思路，有效地实现了在模型性能与隐私安全之间的平衡。首先是对大模型智能层的重要性进行评估，用强化学习给大模型做扫描，自动识别哪些层对当前任务最关键，动态保留模型“核心层”，有效降低模型性能损耗。其次，对保留的模型原始层做“打码”，让攻击者无法通过中间层复原原始模型，可以在性能几乎无损的情况下，显著提升隐私保护强度。最后，该框架还可以根据不同场景需求进行灵活组装，实现隐私强度可调节。

解决数据和模型的隐私安全问题，是大模型在产业界尤其是金融行业落地的重要课题。蚂蚁数科技术团队这一创新的大模型隐私微调算法，为大模型隐私保护提供了新颖的思路与解决方案。目前，该算法已经融入蚂蚁数科旗下的摩斯大模型隐私保护产品中，并已成为国内首批通过信通院大模型可信执行环境产品专项测试的产品之一。

来源：至顶网软件与服务频道

0赞

好文章，需要你的鼓励

蚂蚁数科提出创新跨域微调框架ScaleOT入选全球AI顶会AAAI 2025

来源：至顶网软件与服务频道

2025

02/26

14:05

分享

点赞

数智时代，openGauss Summit 2025即将发布哪些技术创新破局

“算力+储能”深度融合：超智算发布分布式算力超级节点储能解决方案

联想推出DE6600系列：更智能的存储解决方案

创业公司如何在严格监管行业中实现生死攸关的创新

OpenAI发布GPT-5.2-Codex模型，软件工程自动化能力大幅提升

Waterfox浏览器宣布拒绝AI功能，瞄准Firefox忠实用户

TikTok美国业务出售交易将于下月完成

破局AI数据中心安全瓶颈：Fortinet联合NVIDIA引领隔离式加速新航向

智算中心进化论，科华数据如何做到“更懂”

更高负载、更快建设：2026年数据中心六大趋势

Snowflake数据库更新引发全球大规模服务中断

AI编程初创公司Lovable融资3.3亿美元，英伟达等科技巨头支持

魔法原子人形机器人走出“练兵场”

魔法原子举办2025场景战略发布会 官宣“千景共创计划”落地1000个应用场景

首个RWA 上链技术规范立项 “Antchain inside”成行业标准

亚马逊移除了一项重要的 Alexa 隐私设置：你应该担心吗？

从“解题答疑”到“培养思维”，夸克“AI解题大师”定义AI产品新价值

傅利叶正式开源全尺寸人形机器人数据集Fourier ActionNet，并发布全球首个全流程工具链

《AI启示录》：当ERP长出AI神经，胜负手在于业务扎根

奢饰品行业的一个麻烦：这家法国公司想用AI来解决

北沟村的幸福蝶变：一场时间与技术的乡村交响

国产大模型崛起！ERP国产替代破局时刻到来！

如果您非常迫切的想了解IT领域最新产品与技术信息，那么订阅至顶网技术邮件将是您的最佳途径之一

2025 re:Invent ：亚马逊云科技把Agentic AI生态梳理明白了

电子竞技瞬息万变，Team Liquid的“数据+AI”制胜秘籍

中国移动呼和浩特数据中心：只有高效存力先行，AI才能跑出全力

从“支撑工具”到“智能中枢”，AI原生ERP进化

关注官方公众号

关注官方微博

关注官方喜马拉雅

友情链接

业界热点:

魔法原子举办2025场景战略发布会官宣“千景共创计划”落地1000个应用场景