谷歌云加大与 Ginkgo Bioworks 的合作,两家公司日前推出了两项新产品。第一项是推出一个蛋白质大语言模型,使业界的组织和公司能够利用 Ginkgo 的专有见解和数据加快药物发现过程。第二项是生物技术公司 Ginkgo 将推出一个模型应用程序接口(API),帮助机器学习工程师和科学家获取生物学人工智能模型。
谷歌云战略产业副总裁 Chris Sakalosky 和 Ginkgo 人工智能总经理 Ankit Gupta在接受记者采访时讨论了这一激动人心的更新。Gupta 表示,生物学在很大程度上已经从一门纯物理学科转变为一门计算学科。那些能够理解、利用并从大量数据中提取有意义见解的方法和手段的人将最终取得成功。这正是 Ginkgo 生态系统的强大之处,因为 Ginkgo 生态系统提供了简化工程所需的计算工具。
Sakalosky 分享了他第一次与 Ginkgo 生物工程公司创始人 Jason Kelly见面时的见解,并讨论了 DNA本质上可以被视为一种语言和代码。如果创新者可以训练人工智能理解对话、口语和计算机代码,那么人工智能就没有理由不能以同样的方式理解和处理 DNA。这正是这个蓬勃发展领域的关键所在。
新的蛋白质大语言模型背后的前景令人振奋,因为该模型是在谷歌云Vertex人工智能平台上构建的,其训练基于 Ginkgo 的专有数据模型。该模型将使研究人员和企业能够快速理解并利用自己的数据,进而为药物发现带来巨大的好处。此外,Ginkgo 公司提供的新应用程序接口可以访问在蛋白质和 DNA 数据基础上训练的复杂模型。第一个模型是 ginkgo-AA-0-650m,是“一个基于超过20亿个Ginkgo专有蛋白质序列训练的大模型”。
为什么这些都很重要?
生物学、药物研发、人工智能和先进工程学之间的融合从未像现在这样紧密,原因是这些垂直领域之间存在大量相互促进的机会。这就是为什么各家公司都在迅速增加在这一领域的投资,竞争也非常激烈。以 Meta 的 ESM 宏基因组图谱为例,该项目旨在“将数据集中的每个蛋白质表示为一个单独的点,并在放大或悬停时显示实际的蛋白质结构”。
尽管该项目据报已经暂停,但截至2023年3月,该模型的可用蛋白质结构已接近7.72亿个。同样,Alphabet 旗下的 Isomorphic Labs 与 Google DeepMind合作,开发了业界领先的蛋白质模型 AlphaFold。其最新版本 AlphaFold 3 声称“与现有预测方法相比至少提高了50%”。
一项发表在《生物信息学前沿》期刊的研究强调了在蛋白质生物学和工程学中使用大语言模型的巨大潜力:“建模能力在不断增强,预计将解决医学和分子生物学中的一系列复杂问题……通过利用嵌入在深度神经模型参数中的‘联结知识’。”
尽管在这个领域还有大量工作要做,各项工作才刚刚开始,但这项技术为生物科学与人工智能的结合提供了一个令人期待的前景。
好文章,需要你的鼓励
在Meta Connect大会上,Meta展示了新一代Ray-Ban智能眼镜的硬件实力,配备神经腕带支持手势控制,电池续航翻倍,摄像头性能提升。然而AI演示却频频失败,包括Live AI烹饪指导、WhatsApp通话和实时翻译功能都出现问题。尽管Meta在智能眼镜硬件方面表现出色,但AI软件仍远未达到扎克伯格提出的"超级智能"目标。文章建议Meta考虑开放AI生态,允许用户选择其他AI服务商,这可能帮助Meta在AI硬件市场获得优势。
DeepSeek-AI团队通过强化学习技术开发出DeepSeek-R1系列推理模型,无需人工标注即可自主学习复杂推理。该模型在数学、编程等领域表现卓越,在AIME 2024中达到79.8%准确率,编程能力超越96%人类选手。研究团队还通过知识蒸馏技术将推理能力传递给小模型,使7B参数模型也能超越GPT-4o。这项突破为AI推理能力发展开辟新路径。
英伟达同意以50亿美元收购英特尔股份,双方将合作开发多代数据中心和PC产品。英伟达将以每股23.28美元的价格收购约4%的英特尔股份,成为其最大股东之一。两家公司将通过NVLink接口整合各自架构,实现CPU和GPU间的高速数据传输。英特尔将为英伟达AI平台定制x86处理器,并开发集成RTX GPU的x86系统级芯片,用于消费级PC市场。
微软研究院推出rStar-Math系统,通过创新的"深度思考"训练方法,让小型AI模型在数学推理能力上达到甚至超越OpenAI o1水平。该系统采用代码验证、过程偏好模型和四轮自进化训练,将70亿参数模型的数学能力从58.8%提升至90.0%,在美国数学奥林匹克竞赛中达到前20%水平,证明了精巧方法比模型规模更重要,为AI发展开辟了新路径。