根据本周发表的新的研究论文结果,人工智能可以预测火灾中发生的闪燃,从而帮助拯救消防员的生命。
当房间里的可燃材料突然开始全部燃烧,闪燃就会发生,闪燃导致巨大的热量和可燃气体激增,因而墙壁及爆裂窗户可能会突然破裂。在2008年至2018年的10年期间,美国约有800名消防员在工作中死亡,超过32万名消防员受伤,据估计,其中13%的事故是闪燃事件造成的。
消防员必须依靠他们的经验预测闪燃是否即将会发生,例如根据烟雾和热量的水平进行判断,但烟雾和热量水平的变化可能极快,要做出正确的判断并不容易。在过去的20年里,计算机科学家一直在试图开发能够实时检测闪燃的方法,不过要针对如此不稳定的东西进行建模是一项困难的任务。
最近,来自美国政府国家标准与技术研究所(NIST)、谷歌以及香港理工大学和中国石油大学的研究人员利用图神经网络(GNN)的系统从模拟火灾中学习不同数据来源之间的关系,对应的图的节点和边表示数据来源之间的关系。
该项研究论文的共同第一作者、香港理工大学的研究助理教授Eugene Yujun Fu在一份声明中表示,“GNN经常用于估计到达时间(ETA),在分析道路交通时可能要处理涉及10到50条不同道路的信息。”
他表示,“在类似的情况下要同时正确利用这种信息非常复杂,所以我们产生了利用GNN的想法。只是在我们的应用里,我们的研究对象是房间而不是道路,我们预测的是闪燃事件而不是道路交通里的ETA。”
该团队模拟了各种数据,涉及到建筑布局、表面材料、火灾条件、通风配置、烟雾探测器的位置和房间的温度曲线等等,进而针对17种不同建筑类型的41,000次假火灾进行建模。训练模型一共用了25,000个火灾案例,剩下的16,000个案例则用于模型的微调和测试。
GNN的性能评估基于得到的模型是否能够正确预测未来30秒内发生的闪燃事件。初步结果显示,该模型的准确率最高可达92.1%。
该系统名为FlashNet,比该团队之前的机器学习模型P-Flash更加先进。
论文的共同第一作者、NIST机械工程师Wai Cheong Tam表示,“我们以前的模型只需要考虑一个布局中的四个或五个房间,但是当布局换成13或14个房间时,对以前的模型模型来说可能是一场噩梦。我们认为对于现实世界的应用,关键是要换成一个适用于许多不同建筑的通用模型。”
FlashNet可能看起来可以得到很不错的结果,但仍需要用来自真实火灾救援的数据进行测试。Tam告诉记者,所以需要利用该模型分析来自智能家居中的恒温器、一氧化碳和烟雾探测器的数据。目前还不清楚如何用模型的预测结果来提醒消防员。
Tam表示,“该项研究的重点基于现有建筑传感器提供的或可以很容易提供的建筑数据。将该研究结果转化为现实应用的一种方法是将该模型整合到智能火灾报警控制面板中,控制面板可以从装好的热探测器中收集温度数据,可以安装一个计算机模块,用于处理数据并进行实时预测。”
Tam还表示,“预测结果可以从火灾报警控制面板或其他合适的设备发送给消防现场指挥官,有必要时也可以发送给现场的消防员。至于如何提供这种预测性分析的确切机制尚无定论,这需要消防部门的帮助才能形成共识。”
好文章,需要你的鼓励
韩国科学技术院(KAIST)的研究团队发现了大型语言模型中一个令人担忧的现象:"推理刚性"。这种现象表现为即使是最先进的AI模型,如GPT-4o或Qwen3,也会在解决问题时固执地坚持熟悉的推理模式,甚至会"修改"用户明确给出的条件。研究人员创建了ReasoningTrap诊断数据集,揭示这种行为可分为三类:解释过载、输入不信任和部分指令关注。令人惊讶的是,专门为复杂推理训练的模型比基础模型表现出更强的"固执"倾向,这提醒我们在追求AI推理能力的同时,不应忽视其遵循指令的灵活性。
比尔肯特大学研究团队提出RoPECraft,一种无需训练的视频动作迁移方法,通过巧妙操作扩散变换器中的旋转位置编码实现。该方法首先从参考视频提取光流信息,用于扭曲RoPE张量;再通过流匹配优化和相位约束正则化,确保生成视频精确跟随参考动作,同时保持视觉质量。与需要大量计算资源的现有方法相比,RoPECraft不需要模型再训练,大幅降低了计算成本,同时在动作保真度和视频质量上超越了最新技术,为AI视频创作提供了高效可行的动作控制解决方案。
这项来自加拿大滑铁卢大学的研究挑战了"更多训练数据总是更好"的观念,发现某些数据集反而会损害信息检索模型性能。研究者提出了RLHN方法,使用级联LLM技术识别并重标注训练数据中的"假负样本"。实验表明,这种方法显著提升了检索和重排模型在BEIR和AIR-BENCH基准测试上的性能,尤其在处理未见过的领域时效果更佳。人类验证结果证实了该方法的可靠性,为构建更准确、鲁棒的信息检索系统提供了新思路。
这项研究介绍了WebAgent-R1,一种用于训练网页智能体的端到端多回合强化学习框架。不同于传统方法,它直接通过在线交互学习,仅依靠二元任务成功奖励信号指导。实验表明,该方法显著提升了Qwen-2.5-3B和Llama-3.1-8B模型的网页任务成功率,超越了现有最先进技术。研究还揭示了行为克隆的重要性、思考型提示策略的有效性,以及通过增加交互次数来实现测试时性能扩展的新策略。