从能够记录当前库存情况并动态订购所需物品的手持设备,到可整合来自视觉反馈的信息以了解特定人员在仓库轮班时是否满足必要的合规性且配备有公共安全装备,相关的用例多种多样。在第一种用例中,时间序列从基于边缘的手持设备或固定摄像头持续发送到云数据分析服务。相比之下,第二种用例则借助云端的深度学习模型,采用人员检测、追踪和再识别模块,来进行图像抓取。在这两种情况下,边缘设备均是作为向云端传输信息的管道。
我们为何需要边缘智能?
更靠近终端用户的传感器网络延迟更低,且能够节省带宽。此外,在将数据传输到更广泛的云计算基础设施前,还可在设备端进行预处理,这有助于保护从设备中收集和推断出的数据隐私。这些则构成了边缘智能的一些核心要求。具有低水平计算的边缘设备或传感器能够弹性地创建网络(Mesh网络),聊天机器人、仪表盘、智能手机、温度传感器等设备能够间歇性地连接到网络,以收集、计算和分享信息。在传统的物联网世界中,这些传感器能感知世界,并准确地将信号传输到公有云或私有云中。
那么,多台边缘设备是否能够分享自身的输入和有限机载计算来实现同一目标呢?如此一来,我们就拥有了多台有限机载计算的边缘设备,它们可以聚集于一个Mesh网络下,以解决诸如仓库或零售店的资产追踪问题。大体上而言,其用例能够涵盖自主设备(无人机、自主移动机器人、自主车辆)、沉浸式体验(增强现实/虚拟现实可穿戴设备),以及物联网分析(工业和家用传感器)等。
边缘人工智能
我们可以为边缘设备注入强大的“智能性”,基本上有两种在边缘运行机器学习的方法,一种是使用集中式联邦学习工具的集中式拓扑,另一种是模糊数学领域的去中心化分布式(无云数据中心)联邦学习算法。
联邦学习有赖于在计算能力相对低的设备中训练机器学习模型,并将本地习得的模型转移到数据库进行下一步处理。首先,来自云数据中心的云端训练模型会被发送到各台边缘设备,然后使用本地数据,对该模型进行微调,再将模型发送到云平台,以进行模型更新。通信模式可以是同步的,也可以是异步的。此外,有一些类型的统计推理算法使边缘设备能够相互发送消息,从而减少本地模型的通信负载。根据用例的不同,还需要考量距离、延迟和移动性等指标。
第二种方式,使用去中心化的联邦学习,这通常是部署机器学习模型的优选方式。信息分散在各台设备上,而非单一的某个点,进而降低各类网络安全攻击的可用面。从技术上来说,去中心化形式的通信模式可以通过图表、分布式账本或简单的对等网络来进行。这意味着企业可以为仓库、制造工厂、整体零售供应链或商店的一线员工配备精密的由机器学习驱动的设备,利用设备内的机器学习模型,增强并加速通信和决策,并在网络中共享。
边缘智能的前景在于,这种去中心化的拓扑结构将催生新一代的芯片企业。这些企业将专注于计算,并提升每瓦特运行效率,同时致力于计算的协同设计来满足通信需求,例如Mesh拓扑结构(对等网络、分布式账本、图表)。
迈向边缘智能
网络边缘正不断改变着拓扑结构和设备。云端存在着能够动态调度有效载荷的编排算法。然而,对于边缘设备来说,随之而来的还有数以百万计的设备、更多的异质性电源包络,以及各种设备的计算能力等问题。数据采集和模型日益碎片化,在整体数据中,每台设备都占有一定的比例,但无法访问整个数据集。更多的边缘设备正在向着小型化、低功率、有限计算的方向发展。
但与此同时,其为企业及一线员工所带来的助益引人注目,其中包括完善隐私和免受攻击的保护、提升实时自动化决策、降低互联网带宽和云计算成本、提高能源效率、实现更强大的计算能力,并通过明确的投资,为一线员工配备适合其开展工作的先进设备。
研究人员、企业高层和一线员工需要协力同行。研究人员要为技术的成熟发展提供相应的支持,在日后的工作中着重于去中心化算法,结合动态变化的通信模式,优化芯片,并将计算与通信融为一体。而对于仓储、物流和零售业的企业高层来说,这意味着要制定技术成熟度水平发展路线图,以紧跟市场步伐,并确保一线员工拥有先进的设备和软件工具以更好地完成工作。
好文章,需要你的鼓励
Meta正在建设名为Hyperion的数据中心,预计提供5千兆瓦算力支持其AI实验室。该项目占地面积足以覆盖曼哈顿大部分区域,位于路易斯安那州东北部,将在数年内扩展至5GW规模。此外,Meta还计划在2026年启用1GW的Prometheus超级集群。这些项目旨在提升Meta在AI竞赛中对抗OpenAI和谷歌的竞争力,但也将消耗大量电力和水资源。
Skywork AI推出的第二代多模态推理模型R1V2,通过创新的混合强化学习方法,成功解决了AI"慢思考"策略在视觉推理中的挑战。该模型在保持强大推理能力的同时有效控制视觉幻觉,在多项权威测试中超越同类开源模型,某些指标甚至媲美商业产品,为开源AI发展树立了新标杆。
谷歌为其AI驱动的NotebookLM平台新增"精选笔记本"功能,与全球知名作者、研究人员、出版物和非营利组织合作创建高质量互动资源。首批精选笔记本涵盖长寿建议、2025年预测、人生建议和莎士比亚作品等主题。用户可通过聊天界面提问、查看AI生成的摘要、音频概览或流程图与内容互动。该功能在桌面版NotebookLM中已上线,未来将持续增加更多精选内容。
这项由北京大学等多所高校联合完成的研究,首次对OpenAI GPT-4o的图像生成能力进行了全面评估。研究团队设计了名为GPT-ImgEval的综合测试体系,从文本转图像、图像编辑和知识驱动创作三个维度评估GPT-4o,发现其在所有测试中都显著超越现有方法。研究还通过技术分析推断GPT-4o采用了自回归与扩散相结合的混合架构,并发现其生成图像仍可被现有检测工具有效识别,为AI图像生成领域提供了重要的评估基准和技术洞察。