蓝色巨人希望凭借其最新人工智能项目再掀技术波澜。
IBM公司的研究人员们已经开发出一套轻量级海浪预测系统,甚至能够在Raspberry Pi设备上运行模拟任务。
一般来讲,对风力、潮汐以及海洋深度等变量进行计算以预测波浪走势可能需要超级计算机的介入。但就在今年夏季,圣母大学与IBM爱尔兰研究院的研究人员们共同开发出一套新型系统,能够利用其它低成本设备实现波浪预测,且具有相当理想的精度水平。
他们开发出的这套预测系统属于一款常规物理学模型模拟器,即近岸波浪模拟或者简称SWAN——这款波浪建模工具由荷兰德尔夫特理工大学最早开发完成。
研究人员们则利用SWAN为深度学习网络创建训练数据,其中供应SWAN的波浪条件数据来自NOAA国家数据浮标中心; 而实时洋流读数以及风力数据则来自IBM所拥有的The Weather公司。
IBM公司研究科学家Fearghal O’Donncha解释称,他们所创建出的这套深度学习模型能够以现有预测系统12000%的速度生成预测结果。
更高的性能表现意味着该模型将能够创建波浪条件的实时预测结果,并在如Raspberry Pi这类轻量化硬件之上运行模拟任务。
根据O'Donncha的介绍,这项进展可通过改变用于训练深度学习模型的数据集,帮助科学家们追踪更为广泛的物理条件、几何形状以及时间尺度等因素。
这亦有可能帮助各类高度依赖于海洋条件的组织机构(例如航运公司、水产养殖企业以及海军等)更轻松地实现波浪预测。IBM公司还将这种对波浪走势的准确预测能力视为发展可再生资源的关键所在。
O'Donncha同时表示,IBM公司所打造的这套人工智能方案的另一大优势,在于其能够利用现有物理模型的输出结果生成训练数据。
与任何其它AI项目一样,研究人员们需要大量标记数据训练深度官瘾网络。通过使用SWAN或者其它模型,他们将能够获得源源不断的标记训练数据。
O'Donncha在接受至顶网采访时解释称,“我们可以利用物理模型生成数千个波场,而后根据实际观测到的浮标数据进行评估,从而衡量模型的准确性。”
每一条物理模型输出结果都作为一份图像,而对应的精度测量则作为该图像的‘标签’。利用这套物理模型,我们即可根据需求生成尽可能多的标记训练数据。”
然而,IBM公司的这套SWAN“替代方案”目前仍然存在一定局限性。该系统只能对加利福尼亚州蒙特利湾的海浪状况作出准确预测。
尽管如此,他们已经能够利用SWAN四年以来生成的12400条不同输出结果证明其预测结果的有效性。这套模型还会考虑到海浪条件的季节性变化因素,例如冬季风力较大等状况。
为了能够将该模型扩展到其它位置,研究人员们还需要重新利用其它风力、潮汐与海洋数据进行训练。但O’Donncha认为,这对于扩展深度学习模型在新领域中的精度而言是一种必要的投入,且与基于物理因素的模型调整并无不同。
O'Donncha解释称,“这方面工作当中,最为复杂的部分是提取数据以进行模型训练。这是因为模型训练本身速度相对较快。”
他指出,The Weather公司能够提供来自一系列位置的数据,而IBM方面则能够为整个美国海岸线等特定位置创建出一套可实际运行的、经过训练的机器学习模型套件。
他同时补充称,“这些模型随后将可根据一套坐标以实现轻松交付,这意味着任何位置皆可进行超高速预测分析。”
但其可能很难预测各类极端性天气事件(例如台风)所引发的海浪变化。
O'Donncha指出,“通过将这些效应添加至物理模型边界的强制条件当中,即可产生包含台风或者其它极端性天气事件的训练数据。”
“其中的挑战在于如何获取由极端事件所引发的海浪变化的对应标签。从定义层面来讲,极端事件显然非常罕见。”
这套深度学习模型能够对海浪条件作出实时预测,并在小如Raspberry Pi的硬件之上运行模拟任务。
好文章,需要你的鼓励
亚马逊云服务部门与OpenAI签署了一项价值380亿美元的七年协议,为ChatGPT制造商提供数十万块英伟达图形处理单元。这标志着OpenAI从研究实验室向AI行业巨头的转型,该公司已承诺投入1.4万亿美元用于基础设施建设。对于在AI时代竞争中处于劣势的亚马逊而言,这项协议证明了其构建和运营大规模数据中心网络的能力。
Meta FAIR团队发布的CWM是首个将"世界模型"概念引入代码生成的32亿参数开源模型。与传统只学习静态代码的AI不同,CWM通过学习Python执行轨迹和Docker环境交互,真正理解代码运行过程。在SWE-bench等重要测试中表现卓越,为AI编程助手的发展开辟了新方向。
当今最大的AI数据中心耗电量相当于一座小城市。美国数据中心已占全国总电力消费的4%,预计到2028年将升至12%。电力供应已成为数据中心发展的主要制约因素。核能以其清洁、全天候供电特性成为数据中心运营商的新选择。核能项目供应链复杂,需要创新的采购模式、标准化设计、早期参与和数字化工具来确保按时交付。
卡内基梅隆大学研究团队发现AI训练中的"繁荣-崩溃"现象,揭示陈旧数据蕴含丰富信息但被传统方法错误屏蔽。他们提出M2PO方法,通过改进数据筛选策略,使模型即使用256步前的陈旧数据也能达到最新数据的训练效果,准确率最高提升11.2%,为大规模异步AI训练开辟新途径。