随着IBM与Moderna宣布建立合作伙伴关系,共同探索生成式AI与量子计算的潜力,mRNA疫苗也有望在未来几年得到进一步发展。
疫情爆发之初,世界各国竞相研发首种有效疫苗,希望控制住全球人口的感染风险。在这场竞赛中,基于mRNA的疫苗(包括Moderna及其竞争对手辉瑞的疫苗)凭借创新技术取得了胜利。而考虑病毒进一步变异和其他潜在病毒随时爆发的风险,制药企业必须找到新的方法以加快研发流程、以前所未有的效率找到新的治疗方案。为此,Moderna决定与IBM合作,共同探索快速解决问题的新型技术手段。
新思路包括使用IBM开发的生成式AI基础模型。该模型有望帮助Moderna打造出新的mRNA疫苗,突破现有疫苗的种种局限性。与此同时,Moderna还在研究如何运用量子计算技术,解决当前经典计算机无法攻克的难题。
与Moderna的合作,也与IBM的整体发展战略思路相契合,即推广基础模型以赋能各个不同垂直行业。
IBM研究院首席研究员兼可信AI经理Payel Das表示,“我们正在不同的用例当中广泛使用基础模型,具体涵盖医疗保健、金融以及NASA的地理探索等。”
今年早些时候,IBM宣布与NASA建立合作伙伴关系,帮助其构建AI基础模型以推进气候科学研究。除此之外,IBM与学界和科学机构还保持着广泛的合作关系,为其构建各种可解决现实问题的AI模型。IBM还开发了自己的超级计算机平台,专门用于构建基础模型。其中Vela超级计算机就集成了x86芯片、英伟达GPU和以太网络。
IBM将与Moderna合作开发名为MoLFormer的基础模型家族。根据介绍,这些模型由大规模分子数据集训练而成,能够适用多种不同用例、任务和应用场景,并以不同于传统深度学习模型的方式发挥作用。
对于常见的预测性AI深度学习模型,其主要问题在于训练中使用的数据样本往往有限,且大多要通过反复试验来获取。经典机器学习和深度学习模型在标记数据不多时,往往难以取得良好效果。
相比之下,像MoLFormer这样的基础模型拥有广泛的化学知识,且起效方式完全不同。MoLFormer是一套通用模型,已经接受超10亿种化学成分的训练,因此无需访问数据标签即可从中学习新知识。从这个角度来看,该模型几乎可以说已经掌握了基础化学的微妙。
通过这种通用模型,Moderna能够适应不同的下游任务,并表现出相当惊人的性能。
这种基础模型方法,也有助于减少偏见/偏差。
在生命科学数据中,同样可能存在着认知偏差的风险,也包括由实验设置所带来的局限性。通过基础模型方法,AI能够根据Moderna数据进行训练,但又不只限于这些数据之内。以MoLFormer为例,该模型已经处理过超10亿种化合物。
这种AI基础模型将带来种种优势,包括突破特定数据集内的固有偏见。也正因为如此,Moderna才对基础模型这种新的AI实现范式抱有浓厚兴趣。
在另一条赛道上,Moderna正与IBM合作,探索如何将量子计算应用于生命科学中的特定用例。
IBM量子计算科学高级研究经理Jeannette (Jamie) Garcia在采访中表示,“量子计算有望更准确地模拟分子特性和行为,这些分子在本质上一直根据量子力学的原理活动。量子计算可以利用各量子比特之间的纠缠效应建立量子算法,从而更好地捕捉分子系统的行为。”
Garcia指出,Moderna已经参与到IBM量子加速器计划中来。项目将为Moderna科学家提供新的机会,帮助他们探索如何将量子计算应用于未来的mRNA药物研发流程。
另外,量子计算和AI之间的交叉点也是个有待探索的领域。Garcia表示,量子计算终究需要把经典计算跟量子计算元素融合起来的办法。在她看来,量子计算、经典计算和云计算的交汇点可能正是AI。
“我们预计这些路径会在不断发展当中彼此相交。从目前的研究来看,AI也有可能从计算领域的探索中受益,最终带来经典计算无法实现的数据集洞察能力。”
好文章,需要你的鼓励
卢森堡大学研究团队开发的RLDP框架首次将强化学习应用于差分隐私优化,创造性地解决了AI训练中隐私保护与模型效果的矛盾。该方法如同智能教练,能动态调整隐私保护策略,在四种语言模型上实现平均5.6%的性能提升和71%的训练时间缩短,同时增强了抗隐私攻击能力,为敏感数据的AI应用开辟了新路径。
这项由北京大学人工智能研究院完成的研究,首次从数据压缩理论角度揭示了大型语言模型存在"弹性"现象——即使经过精心安全对齐,模型仍倾向于保持预训练时的行为分布。
腾讯混元团队联合北京大学提出MixGRPO技术,通过混合ODE-SDE采样策略和滑动窗口机制,将AI图像生成训练效率提升50%-71%,同时在多项人类偏好评估指标上超越现有方法。该技术采用"从难到易"的渐进优化策略,专注于图像生成早期阶段的重点优化,并引入高阶求解器进一步加速训练过程,为AI图像生成的产业化应用提供了更高效可行的解决方案。