身在澳大利亚的海岸线上,我们常能看到无人机在头顶盘旋、直直朝着闪闪发光的碧绿海水拍摄。“肯定又是网红在这取景”,我们在心里抱怨。但如果认真观察这台飞行器,就会发现上头画着标志,以亮黄色加红色的字母写明“保持畅通”。所以说,这应该不是TikTok播主放的。

没错,它不是网红的玩具,而是保护冲浪爱好者们的大救星。这些无人机负责在海滩上追踪鲨鱼,避免这些危险生物与嬉水者之间距离过近。新南威尔士州政府已经做好准备,计划未来几年内投入巨资(超过8500万美元)以减轻鲨鱼威胁,让人类更好地与这些食肉动物共存。当然,传统的起重机巡逻和防鲨网仍然存在,但2020年的一项调查显示,公众最喜爱的鲨鱼管理方案仍然是这种无人机追踪。
这项举措并不新鲜。自2016年以来,州政府就一直在利用无人机搜寻鲨鱼踪迹,并从2018年开始与Surf Life Saving NSW合作开展工作。无人机的飞行高度超过60米,由训练有素的冲浪救生飞行员操纵。一次次掠过海洋上空所拍下的实时视频并非为了记录美丽的海浪,而是要搜寻水面之下流动的鲨鱼。操纵员们当然接受过如何区分鲨鱼形态(例如大白鲨和虎鲨就明显不同)和其他动物(海豹或大鱼)的培训,但如果天气条件较差,肉眼判断会相当困难。一旦起风、强光射在特定位置、水太浑或者太暗、飞过海藻富集区,拍摄画面将更显得难以辨别。
2017年12月10日拍摄的照片显示,一架鲨鱼侦察无人机在悉尼北部的比尔戈拉海滩上空飞行,机身下方装有安全漂浮装置。去年夏季,高科技鲨鱼侦察无人机在澳大利亚的数十个海滩巡逻、快速识别水下捕食者,以超越救生员的速度为游泳者和冲浪者提供安全设备。
无人机飞行员做出正确判断的比例大约是60%——意义重大,但似乎又不够可靠。正因为如此,一支科学家研究小组才决定探索AI能否做得更好。Cormac Purcell博士获得了新南威尔士州第一产业部的资助,与南十字星大学和迪肯大学的Paul Butcher博士一起在麦考瑞大学开展这项研究。团队着手打造出“最强大”的鲨鱼AI探测器,并立即在澳大利亚海域部署测试。没错,大部分AI技术在实验室中表现还行,但在现实应用时需要应对大量挑战。正因为如此,Purcell和Butcher博士才热衷于在野外测试自己的探测器。他们在报道中写道,“之前,AI增强型鲨鱼识别系统的早期表现已经证明其重要意义,此类系统报告的检测准确度超过90%。但将这些系统扩展至新南威尔士州海滩、在现实场景下实现识别功能一直面临挑战。在本质上,机器学习方案中的AI驱动软件必须定期更新,才能持续保持有效性。”
研究人员努力跟踪和识别鲨鱼,将信息交付给AI软件以使其持续“学习”,从而为冲浪救生员创建一款移动应用。作者们解释道,“使用这套新数据集,我们训练出的机器学习模型能够识别十种海洋生物,包括不同各类的危险鲨鱼,如大白鲨和捕鲸鲨。之后,我们将模型嵌入至新的移动应用当中,由该应用实时标记出无人机镜头中捕捉到的鲨鱼及其对应物种。我们与新南威尔士州政府和Surf Lifesaving NSW密切合作,于2020年夏季在五处海滩试用这款应用程序。”
具体表现如何?“我们的AI鲨鱼探测器表现不错。在现实条件下,它能以80%的成功率逐帧识别出危险鲨鱼。我们还故意给它埋坑,通过使用一年内不同时间或者不同天气条件下的海滩画面来提高测试难度。”目前,这款应用仍存在一些局限,例如难以识别轮廓相似的不同鲨鱼种类,另外容易漏掉体形较小的生物。但该团队坚信AI“如今已经足够成熟,能够部署在澳大利亚海滩上肩负起探测鲨鱼的任务。但与常规软件不同的是,这套方案需要定期接受监控和更新,以保持高度可靠的危险鲨鱼检测能力。”
当前正是澳大利亚的夏季,无人机已经再次出去、扫描海域,为保护海滨游客贡献力量。作者们总结道,“AI能够提高这些无人机装置的监控可靠性,未来甚至可能发展成稳定可靠的全自动鲨鱼发现与响应工具。”
好文章,需要你的鼓励
英特尔携手戴尔以及零克云,通过打造“工作站-AI PC-云端”的协同生态,大幅缩短AI部署流程,助力企业快速实现从想法验证到规模化落地。
意大利ISTI研究院推出Patch-ioner零样本图像描述框架,突破传统局限实现任意区域精确描述。系统将图像拆分为小块,通过智能组合生成从单块到整图的统一描述,无需区域标注数据。创新引入轨迹描述任务,用户可用鼠标画线获得对应区域描述。在四大评测任务中全面超越现有方法,为人机交互开辟新模式。
阿联酋阿布扎比人工智能大学发布全新PAN世界模型,超越传统大语言模型局限。该模型具备通用性、交互性和长期一致性,能深度理解几何和物理规律,通过"物理推理"学习真实世界材料行为。PAN采用生成潜在预测架构,可模拟数千个因果一致步骤,支持分支操作模拟多种可能未来。预计12月初公开发布,有望为机器人、自动驾驶等领域提供低成本合成数据生成。
MIT研究团队发现,AI系统无需严格配对的多模态数据也能显著提升性能。他们开发的UML框架通过参数共享让AI从图像、文本、音频等不同类型数据中学习,即使这些数据间没有直接对应关系。实验显示这种方法在图像分类、音频识别等任务上都超越了单模态系统,并能自发发展出跨模态理解能力,为未来AI应用开辟了新路径。