谷歌今天早些时候表示,其Google Cloud将与工业巨头西门子合作开发新的人工智能产品,帮助优化流程并提高工厂车间的生产率。
两家公司表示,此举目的是将Google的云、人工智能和机器学习技术与西门子的工厂自动化系统结合在一起,帮助制造企业实现运营方式的数字化转型。
目前来看,两家公司是十分契合的。Google Cloud在AI和机器学习方面处于领先地位,而西门子是全球领先的软件和系统供应商之一,致力于帮助工厂更平稳地运行。
谷歌和西门子表示,制造业迫切需要自动化。他们指出,尽管目前很多工业流程都是由数据驱动的,但大多数制造企业仍在使用老旧的软件和多套计算系统分析来自制造工厂的信息,这样做不仅效率低下,而且占用大量资源,因此制造企业需要频繁进行手动更新和检查,以确保数据准确无误。
此外谷歌和西门子表示,尽管少数制造企业已经开始在某些工厂实施了AI技术,但其中很多项目都变成了工厂中孤立的“孤岛”。普遍来看,制造企业都极力在其全球业务中大规模实施AI。
总而言之,这些就是谷歌和西门之想要解决的问题。双方计划将Google的数据云、AI、机器学习服务,与西门子的Digital Industries Factory Automation工具集成在一起,帮助企业协调工厂数据并在其上运行基于云的分析和AI,在网络边缘部署算法。谷歌和西门子表示,这样一来,制造企业就可以在网络边缘运行新的应用,例如可以利用视觉技术检查产品、确保质量的计算机视觉应用,以及可以预测流水线机器磨损的算法。
西门子副总裁Axel Lorenz承诺,谷歌AI专业技术与西门子工业边缘系统的结合,将为制造企业带来“改变游戏规则的一场变革”。两家公司尚未发布任何正式产品,但表示,双方的合作将让制造企业可以轻松地在工业规模上大规模部署AI,实现日常任务的自动化并提高生产率。
“通过简化工业用例中的AI部署,我们将在工厂为从事关键任务的员工提供辅助,”Google Cloud制造与工业业务执行董事Dominik Wee表示。
“像企业的所有职能领域一样,在采用AI功能方面,工厂车间具有巨大的优势,”Constellation Research分析师Holger Mueller这样表示。
好文章,需要你的鼓励
新加坡国立大学研究人员开发出名为AiSee的可穿戴辅助设备,利用Meta的Llama模型帮助视障人士"看见"周围世界。该设备采用耳机形态,配备摄像头作为AI伴侣处理视觉信息。通过集成大语言模型,设备从简单物体识别升级为对话助手,用户可进行追问。设备运行代理AI框架,使用量化技术将Llama模型压缩至10-30亿参数在安卓设备上高效运行,支持离线处理敏感文档,保护用户隐私。
阿里达摩院联合浙江大学推出VideoRefer套件,这是首个能够精确理解视频中特定物体的AI系统。该系统不仅能识别整体场景,更能针对用户指定的任何物体进行详细分析和跨时间追踪。研究团队构建了包含70万样本的高质量数据集VideoRefer-700K,并设计了全面的评估体系VideoRefer-Bench。实验显示该技术在专业视频理解任务中显著超越现有方法,在安防监控、自动驾驶、视频编辑等领域具有广阔应用前景。
OpenAI推出新AI模型GPT-5-Codex,能够在无用户协助下完成数小时的编程任务。该模型是GPT-5的改进版本,使用额外编码数据训练。测试显示,GPT-5-Codex可独立工作超过7小时,能自动发现并修复编码错误。在重构基准测试中得分51.3%,比GPT高出17%以上。模型可根据任务难度调整处理时间,简单请求处理速度显著提升。目前已在ChatGPT付费计划中提供。
Sa2VA是由UC默塞德等高校联合开发的突破性AI系统,首次实现图像视频的统一理解与精确分割。通过巧妙融合SAM-2视频分割技术和LLaVA多模态对话能力,Sa2VA能够同时进行自然对话和像素级物体标注。研究团队还构建了包含7万多个复杂视频表达式的Ref-SAV数据集,显著提升了AI在长文本描述和复杂场景下的表现。实验显示,Sa2VA在多个基准测试中达到业界领先水平,为视频编辑、医疗诊断、智能监控等领域带来新的应用可能性。