美国国家航空航天局(NASA)的“野火数字孪生”项目可以为消防员和野火管理者监测野火和预测有害空气污染事件提供一种上佳的工具,也可以帮助研究人员更精确地观测全球野火的趋势。
野火数字孪生工具可以利用人工智能和机器学习实时预测潜在的火灾蔓延路径,可以将来自现场、机载和空间传感器的数据合并起来生成高精度的全球模型。
目前描述野火和烟雾蔓延的传统全球模型的空间分辨率约为每像素10公里,而野火数字孪生生成的区域集合模型的空间分辨率为每像素10-30米,精度提高了两个数量级。而且生成这些模型只需短短几分钟,相较之下,目前传统的全球模型需要几个小时才能生成。
能够以这种速度生成如此高空间分辨率的模型对于急救人员和野火管理者来说将具有巨大的价值,因为他们需要观察和控制动态燃烧事件。
美国马里兰大学巴尔的摩郡分校计算机科学与电子工程系教授Milton Halem是野火数字孪生项目的负责人,该项目的团队由来自六所大学的20多名研究人员组成。
Halem 表示,“我们希望能够为消防员提供有用的、及时的信息。”他补充表示,“在野外一般都没有互联网,也无法使用大型超级计算机,但利用我们的API版模型,他们可以在笔记本电脑甚至平板电脑上运行数字孪生。”
野火数字孪生项目得到了NASA地球科学技术办公室的支持,地球科学技术办公室的最新项目元素名为“支持野火科学、管理和减灾的技术开发”,该项目致力于开发预测和管理野火的新型观测能力,包括地球系统数字孪生等技术。
地球系统数字孪生是一系列用于实时建模和预测气候事件的动态软件工具。这些工具依靠分布在多个领域的数据源创建各种整体预测,包括洪水、恶劣天气等等。
专门用于野火建模的地球系统数字孪生除了可以为急救人员提供帮助以外,对于监测全球野火趋势的科学家来说也很有价值。Halem特别希望野火数字孪生系统能够提高我们研究全球北方耐寒针叶树林野火的能力,北方耐寒针叶树林可以吸收和储存大量的碳。
而当耐寒针叶树林燃烧时,所有的碳都会释放到大气中。一项2023年8月发布的研究发现,北方地区野火的二氧化碳排放量占了2023年当时全球二氧化碳总排放量的 25%。
Halem表示,“北方地区野火产生的二氧化碳排放量之所以逐年增加,原因在于高纬度地区的全球变暖速度比地球其他地区快,因此北方地区的夏季变得更长了。地球其他地区的气温与工业革命前相比可能上升了一摄氏度,北方地区的气温却上升了2摄氏度以上。”
Halem的研究工作建立在其他野火模型的基础上,特别是美国国家航空航天局(NASA)开发的“NASA统一天气研究和预测”(NUWRF)模型以及一个在美国国家科学基金会(National Science Foundation)的支持下的研究小组开发的 WRF-SFIRE 模型。这些模型可以模拟风速和云层等现象,是野火数字孪生系统理想的基础模型。
Halem的团队目前正在研究新的卫星数据同化技术,进而将空间遥感器的信息融合到野火数字孪生系统中,以改进全球数据预报,这对紧急情况和科学任务都非常有用。
Halem的团队去年10月与美国国家林务局的火灾和烟雾模型评估实验(FASMEE)合作进行了首次 FireSense 实地活动。他们在犹他州的一次受控燃烧中利用一台测云仪观测烟雾移动了10多英里的情况。研究小组现在正在将这些数据输入他们的建模软件里,以帮助软件更准确地跟踪烟雾团的移动。
他们对追踪小于2.5微米的颗粒特别感兴趣,这些小颗粒足以通过人的肺部进入血液。这些颗粒又名PM2.5。即使人不在活跃的燃烧源附近,这些颗粒也会造成严重的健康问题。
Halem 表示,“这些火开始燃烧时会产生烟雾,烟雾可以传播相当远的距离。不仅会影响到当地的人,还会影响到几千公里甚至更远地方的人。”
这次受控燃烧产生的数据还可以帮助 Halem 和他的团队量化气溶胶与降水之间的关系。野火造成气溶胶的增加,可以对云的形成产生巨大影响,而云的形成反过来又会影响火灾下游的降水情况。
能够实时从传感器中获取并整合来自传感器的所有信息十分关键,这些信息能够详细描绘野火在当地、所在的区域和全球范围内造成的全面影响。
好文章,需要你的鼓励
这项研究介绍了VisCoder,一个经过专门微调的大语言模型,用于生成可执行的Python可视化代码。研究团队创建了包含20万样本的VisCode-200K数据集,结合了可执行代码示例和多轮修正对话。在PandasPlotBench基准测试中,VisCoder显著优于同等规模的开源模型,甚至在某些方面超越了GPT-4o-mini。研究还引入了自我调试评估模式,证明了反馈驱动学习对提高代码可执行性和视觉准确性的重要性。
这项研究提出了"适应再连续学习"(ACL)框架,一种创新的方法解决预训练模型在连续学习中的稳定性-可塑性困境。通过在学习新任务前先对模型进行适应性调整,ACL使模型既能更好地学习新知识(提高可塑性),又能保留已有知识(维持稳定性)。实验证明,该框架能显著提升各种连续学习方法的性能,为解决人工智能系统中的"灾难性遗忘"问题提供了有效途径。
这篇研究首次关注了CLIP模型文本编码器的对抗鲁棒性问题,提出了LEAF方法(Levenshtein高效对抗性微调)来增强文本编码器的稳健性。实验表明,LEAF显著提高了模型在面对文本扰动时的性能,在AG-News数据集上将对抗准确率从44.5%提升至63.3%。当集成到Stable Diffusion等文本到图像生成模型中时,LEAF显著提高了对抗噪声下的生成质量;在多模态检索任务中,它平均提高了10个百分点的召回率。此外,LEAF还增强了模型的可解释性,使文本嵌入的反演更加准确。
BenchHub是由韩国KAIST和Yonsei大学研究团队开发的统一评估平台,整合了38个基准中的30万个问题,按技能、学科和目标类型进行精细分类。研究显示现有评估基准存在领域分布偏差,而BenchHub通过自动分类系统和用户友好界面,让用户能根据特定需求筛选评估数据。实验证明模型在不同领域的排名差异巨大,强调了定制化评估的重要性。该平台支持多语言扩展和领域特化,为研究人员和开发者提供了灵活评估大语言模型的强大工具。