西门子近日宣布将深化与英伟达的合作,助其构建工业元宇宙。西门子将为西门子Xcelerator平台带来由全新NVIDIA Omniverse Cloud APIs支持的沉浸式可视化技术,推动人工智能驱动的数字孪生技术得到更多的应用。
在英伟达全球技术大会(NVIDIA GTC)上,西门子和英伟达展示了生成式人工智能如何彻底改变复杂数据的可视化,使逼真成为可能,并展示了可持续造船厂HD Hyundai如何利用它来开发新产品。
Siemens AG总裁兼首席执行官Roland Busch表示:“我们将彻底改变产品和体验的设计、制造和服务方式。在通往工业元宇宙的道路上,下一代工业软件能够让客户像在现实世界中那样体验产品:在北京环境中、在令人惊叹的逼真度中,并在未来通过自然语言输入与产品进行交互。”“通过与英伟达的合作,我们将在Siemens Xcelerator产品组合中引入加速计算、生成式人工智能和Omniverse集成。”
英伟达公司创始人兼首席执行官黄仁勋表示:“全方位人工智能和生成式人工智能正在推动工业企业的大规模转型。”“西门子正在将英伟达平台带给他们的客户,并为行业领导者开辟新的机遇,构建下一波各种规模的人工智能数字孪生。”
在下一阶段的合作中,西门子将于今年晚些时候为 Teamcenter X 推出一款新产品,Teamcenter X是西门子业界领先的云端产品生命周期管理 (PLM) 软件,是Siemens Xcelerator平台的一部分。
该产品由NVIDIA Omniverse技术提供支持,将为工程团队提供创建数字孪生的能力,这些数字孪生超级直观、逼真、实时,而且是基于物理的,从而消除工作流程中的浪费和错误。
使用生成式人工智能,将大大加快设置和调整逼真渲染中的细节的速度,如材料定义和照明环境,以及其他辅助场景资产。以前需要数天才能完成的任务,现在只需数小时就能完成,而且工程数据的环境与现实世界中的数据一模一样。
除工程设计外,从销售和营销团队到决策者和客户等其他利益相关方也将受益于对真实世界产品外观的深入洞察和理解,从而做出更明智、更快速的决策。
西门子与英伟达合作,为可持续船舶制造领域的市场领导者 HD Hyundai 展示了实时、逼真的可视化技术。
HD Hyundai 一直在开发以氨和氢为动力的船舶,这是一个复杂的过程,需要对包含700多万个离散部件的船舶进行监督。HD Hyundai 可以使用这款新产品对这些庞大的工程数据集进行交互式统一和可视化。
HD Hyundai 首席信息官兼首席数字官 Taejin Lee 表示:“长期以来,我们一直信赖Siemens Teamcenter的产品生命周期管理功能。基于这种信任,通过这次新的合作,我们将能够对船舶的数字孪生进行可视化和交互,同时利用生成式人工智能创建对象和 HDR 背景,以便更好地了解项目背景。这将在许多方面带来益处,因为它将减少错误,改善客户体验,同时节省时间和成本。”
好文章,需要你的鼓励
这项由加州大学圣地亚哥分校和微软研究院合作开发的REAL框架,通过程序分析反馈训练大型语言模型生成高质量代码。与传统方法不同,REAL采用强化学习将代码安全性和可维护性作为奖励信号,不依赖人工标注或特定规则。研究在多个数据集上的实验表明,REAL在保证功能正确性的同时显著提高了代码质量,有效解决了"即兴编程"中的安全漏洞和维护性问题,为AI辅助编程提供了新的范式。
加州大学伯克利分校与Meta FAIR研究团队开发了"Self-Challenging"框架,让大语言模型通过自己创建和解决任务来提升能力。该方法引入创新的"Code-as-Task"格式,包含指令、验证函数、示例解决方案和失败案例,确保生成的任务既可行又有挑战性。在工具计算、网页浏览、零售服务和航班预订四种环境测试中,仅使用自生成训练数据,Llama-3.1-8B模型性能提升了两倍多,证明AI可以通过自我挑战实现有效学习,减少对人类标注的依赖。
南洋理工大学与SenseTime Research合作提出了PoseFuse3D-KI,一种创新的人体中心关键帧插值框架。该方法将3D人体模型信息融入扩散过程,解决了现有技术在处理复杂人体动作时产生扭曲结果的问题。研究团队开发了专门的SMPL-X编码器直接从3D空间提取几何信息,并设计了融合网络将3D线索与2D姿态无缝整合。他们还构建了CHKI-Video数据集,包含2,614个视频片段及完整的人体标注。实验结果显示,PoseFuse3D-KI在PSNR上提升9%,LPIPS减少38%,显著超越现有方法。
这项研究提出了LongGuide算法,解决了大型语言模型在长文本生成任务中的局限性。研究团队发现,仅依靠上下文学习无法使模型充分掌握文本的语言和格式特性。LongGuide通过自动生成两种指导原则:度量指导原则和输出约束指导原则,显著提升了模型性能。在七种长文本生成任务中,该方法使开源和闭源模型的ROUGE-L评分平均提高约6%。LongGuide具有通用性强、易于学习、成本效益高等优点,为提升AI长文本生成能力提供了新方向。