英伟达本周表示,已有十多家机器人制造商采用英伟达的数字孪生平台复制实体工厂,并在实时3D图形协作平台中进行重建。
这项技术为未来奠定了基础,智能工厂可以让企业更高效地制造机器人和其他设备。
英伟达首席执行官黄仁勋(Jensen Huang)表示,“机器人时代已经到来了,所有移动的东西有朝一日都会是自主的,我们正在努力推进英伟达机器人相关产品,加速实现生成式实体人工智能。”
英伟达工作流平台将英伟达Metropolis视觉人工智能、英伟达Omniverse仿真渲染和模拟以及英伟达Isaac人工智能机器人开发和部署结合在了一起。
英伟达表示,比亚迪电子、西门子、Teradyne Robotics和Intrinsic(Alphabet 旗下的公司)等全球十多家机器人制造商正在将Isaac机器人平台、Omniverse和人工智能模型整合到自己的框架和机器人模型中。
英伟达的五款软件产品旨在创建用于模拟和测试的虚拟工厂。
英伟达表示,最终目标是使仓库和配送中心变得高效且对于人类“同事”来说更加安全,并可以充当人类的智能助手去完成重复性或超精确的任务。
例如,Isaac机械手(Isaac机器人平台的一部分)可以感知、理解工厂环境并与之互动,还可以创建虚拟机械臂,然后对虚拟机械臂进行研究和测试,创建出更好的实体机器人。
英伟达的机器人技术包括Omniverse和GR00T项目。
GR00T是一个GPU加速模拟平台,可创建在英伟达全新Blackwell SoC架构上运行的仿人人工智能基础模型。Omniverse平台可以为开发人员提供相关模块、API和微服务,可以为现有机器人工厂创建精确的实体世界规模仿真。
用户申请早期使用计划或购买SDK后,可以将3D仿真应用程序放在英伟达Omniverse平台上运行。
富士康正在使用英伟达的Omniverse平台和一些合作伙伴的工具,通过软件构建其数字孪生系统。
富士康董事长刘扬伟在一篇博客文章中表示,“我们的数字孪生将引导我们将自动化和工业效率提升到新的水平,进而节省时间、成本和能源。”
富士康在全球拥有 170 多家工厂。富士康官方表示,旗下新的“虚拟工厂”可以推动工业自动化技术的发展。该虚拟工厂是富士康位于墨西哥电子工业中心瓜达拉哈拉的一家新工厂的数字孪生,富士康的工程师可以通过该数字孪生系统以虚拟的形式定义流程和培训机器人,从而使实体工厂以更高的效率运行。
英伟达产品营销总监Madison Huang在博客中表示,“为了设计出最佳的装配线,工厂工程师需要为几十个机械臂找出最佳位置,每个机械臂都重达几百磅。为了准确地监控整个流程,他们在一个矩阵里放了几千个传感器,包括许多联网摄像头,这个矩阵可以向工厂操作员展示所有正确的细节。”
例如,机械臂可以学习如何去拿起英伟达Blackwell服务器并将其放置在自主移动机器人(AMR)上。这些机械臂可以利用 Isaac 机械手的功能找到产品的检测路径,即便路径被物体挡住。
Madison Huang表示,“全球约有1000万家工厂,价值46万亿美元的制造业是一个机遇与挑战兼具的数字孪生应用场景。”
好文章,需要你的鼓励
OpenAI推出ChatGPT Images新版本GPT Image 1.5,承诺更好的指令遵循、更精确的编辑功能和高达4倍的图像生成速度。该模型面向所有ChatGPT用户和API开放。这是OpenAI在CEO奥特曼宣布"红色警报"后与谷歌Gemini竞争的最新升级。新模型提供后期制作功能,支持更精细的编辑控制,能在编辑过程中保持面部相似度、光照、构图和色调的视觉一致性,解决了传统AI图像工具迭代编辑时缺乏一致性的问题。
艾伦人工智能研究所开发的olmOCR 2通过创新的单元测试训练方法,将文档识别准确率提升至82.4%,在处理复杂数学公式、表格和多栏布局方面表现卓越。该系统采用强化学习和合成数据生成技术,实现了完全开源,为全球研究者提供了先进的OCR解决方案,推动了AI技术民主化发展。
Zoom推出AI Companion 3.0,采用联邦AI架构结合自研模型与OpenAI、Anthropic等第三方大语言模型。新版本具备智能工作流、对话式工作界面等功能,可将会议对话转化为洞察、进度跟踪和文档内容。系统支持加密传输,不使用客户内容训练模型。用户可通过ai.zoom.us访问,或以每月10美元独立购买。
苹果公司发布了包含40万张图片修改案例的AI训练数据集Pico-Banana-400K,涵盖35种修图操作类型。该数据集采用严格质量控制,包含成功失败案例对比和多轮修图场景。研究显示AI在全局修改方面表现优秀,但精细操作仍有挑战。这为AI修图技术发展奠定基础,未来将让修图软件更智能易用。