至顶网软件频道消息:
几十年来,视频监控一直用于检测和制止家庭、企业和公共场所的犯罪行为。但是当你回顾这些年的时候,会发现视频监控已经有了令人吃惊的发展。如今不仅视频质量更好了,其背后的软件也更是如此。
当你回顾视频监控行业和所有进入市场的新兴先进技术,你会不禁对这些年的发展感到无比兴奋。
想想以前你得叫很多专业人员来,在你家里接线搭建一个安全系统——穿墙而过,布一堆电线——现在普通的房主不需要借助多少资源就能自己安装好智能摄像头。
以前企业不得不有一个专门的团队全天候监控安全摄像头,而现在大部分监控都是自动化的,有可疑行为的时候会通知安全人员。
过去几年视频监控技术所取得的进步是巨大的,但是我们只看到了表面。还有其他一些发展让视频监控行业进入到一个完全不同的层次。
人工智能正在影响着人们生活与工作中的方方面面。安全行业正在受到越来越多的关注,我们开始看到一个“智能”摄像头中的世界是什么样的。
通常情况下,监控摄像头可以为公民、企业、执法机构提供实时情况监控,或者回看已经发生的某些事情。整合了AI技术的高级安全摄像头,让用户能够实时监控情况,并在问题发生之前识别出问题。
数据科学家Mahesh Saptharishi博士表示:“包含视频分析功能的监控系统可以实施分析视频内容,检测出可能构成威胁的异常活动。基本上,视频分析技术可以帮助安全软件‘学习’什么是正常情况,这样它就可以检测出异常情况,以及某个个人可能忽略的潜在危害行为。”
这是AI与视频监控相结合的关键驱动因素之一。其背后的想法是,先进的软件可以完善人类的判断力,提供更准确、更安全的监控。但这并不意味着取代人类监控,而是让这个过程更细致化和更个性化。
人类一直都希望把AI与视频监控整合到一起,但是在此之前从技术层面(从硬件角度)都是无法实现的,现在这个情况有所改观。
“AI和机器学习这个新的发展前沿,可以在现实世界的产品中部署这些技术。这意味着让电力需求将至较低水平使其能够潜嵌入摄像头本身,”一家技术公司的副总裁Remi El-Ouazzane表示,该公司正在开发一种选择监控摄像头的新处理技术。
据报道,这种新的处理技术将可以实现人群密度监测、面部识别、立体视觉、非法停放车辆检测和行为分析等新功能。
欣慰分析是很多科技公司正在研究的,其想法是高级安全摄像头可以识别与犯罪和其他公共安全问题相关的前兆。
西日本旅客铁路公司就是一个很好的例子。在发现日本有60%被火车碰撞的人都是醉酒的人之后,该公司安装了46台安全摄像头,可自动搜寻和检测醉酒迹象。这套AI系统可以检测那些在长椅上打盹、绊倒、跌倒或者长时间站立不动的人,并通知工作人员前去检查这些人是否身处危险之中。
无论何时提到视频监控这个话题的时候,总是会伴随着公众对隐私的疑虑。没有人希望总是被一直监控着。虽然你可能会有些不舒服,但是这些技术背后的人们确保系统知道何时停止收集信息,以及什么时候转开视线。例如,家中安装的摄像头会在某些“亲密”情况发生的时候被关闭。
“我不想给你举太多例子,因为作为一名法国人我可能会惹上麻烦,”El-Ouazzane开玩笑地说。
高级摄像头系统中整合AI技术,这是不可避免且令人兴奋的。虽然加强监控总是伴随着潜在风险,但是潜在的优点显然超过了缺点。我们可能还需要几年时间才能看到大规模采用,但是很期待未来会出现一大波面向人工智能的应用出涌现。
好文章,需要你的鼓励
Meta宣布为Facebook Dating推出AI聊天机器人助手,帮助用户找到更匹配的对象。该AI可根据用户需求推荐特定类型的匹配者,并协助优化个人资料。同时推出Meet Cute功能,每周提供算法选择的"惊喜匹配"。尽管18-29岁用户匹配数同比增长10%,但相比Tinder的5000万日活用户仍有差距。AI功能已成为约会应用标配,Match Group等竞争对手也在大力投资AI技术。
字节跳动团队提出RewardDance框架,首次系统性解决视觉生成中的奖励模型扩展问题。该框架通过将奖励预测转为生成式任务,并将模型规模扩展至260亿参数,同时集成任务指令、参考样例和推理能力,有效解决了"奖励作弊"问题。实验显示,在文本生成图像任务中质量提升10.7分,视频生成性能改善49%,达到行业领先水平,为AI视觉创作提供了更强大可靠的技术基础。
Neo4j认为已找到让生成式AI访问图数据库记录的方法。图数据库专注于数据点之间的关系建模和查询,在欺诈检测、推荐引擎等场景中表现出色。2024年4月,ISO批准了图查询语言GQL标准,Neo4j的Cypher查询语言完全符合该标准。现代工具提供拖拽式工作流程,GenAI可作为自然语言接口,将用户请求转换为Cypher查询。
ByteDance团队开发的Mini-o3系统通过深度多轮推理突破了传统AI视觉理解的局限。该系统能像人类侦探般进行几十轮的视觉探索,在困难的视觉搜索任务上准确率达48%,相比现有模型提升显著。核心创新包括挑战性的Visual Probe数据集、多样化推理策略训练和突破性的过轮掩码技术,实现了测试时思考轮数的自然扩展。