IBM和NASA近日发布了一款人工智能模型,帮助研究人员更快地分析卫星数据。
该模型在Hugging Face上提供,这是一个类似GitHub的流行平台,用于共享开源神经网络。IBM和NASA的下一阶段合作将重点把AI能力扩展到更多用例中,并与马萨诸塞州伍斯特市的克拉克大学合作开展该计划。
IBM研究院AI副总裁Sriram Raghavan表示:“开源技术加速了气候变化等关键领域的发现。”
IBM表示,这种新模型旨在帮助研究人员识别美国大陆可能面临洪水和野火风险的地区,并且分析地理空间数据的速度要比最先进的神经网络快四倍,训练所需的数据也更少。
IBM把这种AI称为一个基础模型,或者说是一个可以执行各种高级计算任务的模型。它基于Transformer架构,一种流行的神经网络设计方法。Transformer模型在推理一段数据时可以考虑大量上下文信息,这使其能够比其他AI系统做出更准确的决策。
这项技术支撑着市场上许多先进的AI系统,其中就包括OpenAI最新的大型语言模型GPT-4。
IBM和NASA在名为Harmonized Landsat Sentinel-2的地理空间数据集上联合训练了他们的模型,这个数据集包括由NASA Landsat-8 卫星拍摄的地球表面图像,以及来自欧洲航天局运营的卫星星座Sentinel-2的测量数据。
IBM使用其内部开发的Vela超级计算机训练这个AI模型。今年早些时候IBM推出的这套系统采用了Nvidia的A100系列数据中心图形芯片,Vela使用的是A100高端版本,具有特别大的板载内存池,用于存储AI模型。
除了Nvidia的芯片之外,Vela超级计算机还配备了IBM开发的虚拟化软件。虚拟化使某些AI开发任务变得更加容易,但这种简单性是以降低处理能力为代价的,不过IBM表示,它将性能影响降低到了5%以下,研究人员将其描述为“我们所知业内最低的开销”。
尽管IBM和NASA优化了他们的模型来检测有洪水和野火风险的区域,但他们估计该模型也可以适用于其他用例,例如跟踪森林砍伐行为,以及帮助研究人员监测碳排放并预测作物产量。
未来,IBM计划进一步扩展AI功能,IBM已经在与NASA和克拉克大学的研究人员合作进行这项工作。
在该计划中,IBM希望优化时间序列分割和相似性研究的模型,这是两种主流的数据分析方法,不仅用于地理空间研究,还用于一系列其他任务,例如,时间序列分割可用于研究股票价格波动的原因。
IBM最终计划通过Watsonx产品套件提供该模型的商业版本。Watsonx产品套件是在今年5月推出的,其中包括了一系列软件工具,旨在帮助企业构建先进的AI模型并将其部署到生产中,此外还有针对各种用例进行优化的预打包神经网络。
Watsonx是由Red Hat OpenShift AI提供支持的,后者是IBM机器学习产品组合中最近推出的另一个组件,是OpenShift应用开发和部署平台的一个版本,专门针对AI工作负载进行了优化,简化了监控生产中运行的机器学习模型的性能等任务。
好文章,需要你的鼓励
开放闪存平台(OFP)旨在用直接访问的闪存盒替代全闪存阵列,每个闪存盒配备控制器DPU、Linux系统和并行NFS软件。该倡议由Hammerspace主导,针对新云、超大规模和AI公司在数据中心设计演进中面临的基础设施限制。OFP通过结合IPU/DPU技术、闪存优化机箱和Linux协议,提供高密度、低功耗的存储解决方案,满足AI应用从PB级向EB级数据容量需求的扩展。
MBZUAI研究团队发布了史上最大的开源数学训练数据集MegaMath,包含3716亿个Token,是现有开源数学数据集的数十倍。该数据集通过创新的数据处理技术,从网页、代码库和AI合成等多个来源收集高质量数学内容。实验显示,使用MegaMath训练的AI模型在数学推理任务上性能显著提升,为AI数学能力发展提供了强大支撑。
ERP系统市场近年来相对稳定,但AI正在改变一切。供应商们正竞相在产品组合中嵌入AI功能,构建包括可组合应用、集中数据存储和可扩展云平台的生态系统。Oracle凭借AI投资超越SAP成为ERP收入领导者,而AI代理已从实验阶段进入实际应用,能够管理整个工作流程并进行自动化决策。本文盘点了Oracle、SAP、微软等十大最具影响力的ERP厂商及其AI战略。
这项由多个知名机构联合开展的研究揭示了AI系统的"隐形思维"——潜在推理。不同于传统的链式思维推理,潜在推理在AI内部连续空间中进行,不受语言表达限制,信息处理能力提升约2700倍。研究将其分为垂直递归和水平递归两类,前者通过重复处理增加思考深度,后者通过状态演化扩展记忆容量。