至顶网软件频道消息:由于亚马逊网络服务公司(Amazon Web Services Inc.)在星期一早晨推出了一个新的开发平台,虚拟现实和增强现实等沉浸式技术可能很快就会变得更加普及。
这家公有云计算巨头揭开了其新的Amazon Sumerian服务的面纱,它为开发人员提供了一个平台,可以创建逼真的虚拟环境,可以使用动画角色和其他3D对象对其进行填充。亚马逊公司(Amazon.com Inc.)星期一在一个不同寻常的“午夜疯狂(Midnight Madness)”活动中宣布了Sumerian,该活动是这家公司在拉斯维加斯举办的、为期一周的年度re:Invent大会的前夜活动,参加活动的人都是经过挑选的。
此举出现在各行各业的企业对增强现实(AR)和虚拟现实(VR)技术表现出浓厚兴趣之际。移动软件开发公司Niantic Inc.在2016年6月份发布了其大热的精灵宝可梦(Pokemon Go)游戏,让这项技术名声大噪,而该技术除了游戏之外,也已经被应用于很多其他的应用程序之中。在去年,增强现实(AR)和虚拟现实(VR)在打造更逼真的训练模拟、虚拟礼宾服务和虚拟家庭旅游等方面已经大放异彩。
但增强现实(AR)和虚拟现实(VR)的体验还很少,尤其是因为大多数开发人员缺乏将其纳
入应用程序所需的专门技能。亚马逊认为,增强现实(AR)和虚拟现实(VR)支持的应用程序的主要问题是创建它们需要使用各种工具的专业知识,包括诸如3D建模、环境设计、动画和音频编辑等。部署这些应用程序也是一个问题,因为每个平台都有自己独特的规范和流程需要遵循。
AWS正在试图用Sumerian解决这一问题。该公司表示,这项新服务消除了对这种专业知识的需求,使开发人员能够轻松创建基于增强现实(AR)和虚拟现实(VR)的应用程序,并在任何支持WebGL或Web虚拟现实(VR)图形渲染的平台上运行它们。这包括移动设备、网页浏览器和Facebook公司的Oculus Rift等头戴式显示器。
Sumerian将基于Web的编辑器与可视化脚本工具结合在一起,允许开发人员将角色和对象“拖放”到自己创建的“场景”中,还可以控制他们的行为方式和对操作的响应。
该服务提供了一个预建对象库,开发人员可以使用它来填充自己的增强现实(AR)和虚拟现实(VR)应用程序,还有一些场景模板可以实现滚动。开发人员也可以使用该平台创建自己的对象和场景。这些可视脚本工具利用了Amazon Lex和Amazon Polly等AWS服务,这些服务提供自动语音识别、自然语言理解和文本到语音转换功能,所以这些虚拟角色可以与人类用户交互。
AWS的技术副总裁Marco Argenti表示,“各行各业的客户发现虚拟现实(VR)和增强现实(AR)技术在各种用途方面的潜力——从教育和培训员工到创造新的客户体验。”他表示, “但是,构建虚拟现实(VR)或者增强现实(AR)应用程序即使在一开始所需要的专业技能和工具也需要可观的前期投入,这让客户不知所措,难以应对。现在有了Amazon Sumerian,任何开发人员都可以在几个小时内创建出真实的交互式虚拟现实(VR)或者增强现实(AR)应用程序。”
Mapbox业务开发副总裁Alex Barth表示,Sumerian还利用Mapbox公司的地图服务,因此开发者们可以将3D地图和定位服务整合到他们的增强现实(AR)和虚拟现实(VR)应用程序中,并“将基于位置的体验变为现实”。他表示,“例如,我们将Mapbox的兴趣点和全球地形图与Amazon Sumerian整合在一起,所以数据可以实时传送和呈现。”
亚马逊表示,从今天开始,Sumerian可以通过其AWS管理控制台(AWS Management Console)进行预览。该服务的价格是根据存储3D资产的存储量和流量规模计算的。
好文章,需要你的鼓励
当前软件工程团队正在试验基于AI代理的编码工具和大语言模型,以提高开发速度和质量。然而,AI编码工具的效果很大程度上取决于使用方式。开发者需要提供结构化的问题描述、明确的执行要求和相关上下文,同时建立适当的防护机制。AI不仅能处理重复性任务,还能识别和评估替代方案,从被动助手演进为工作流程推进器。成功的关键在于将AI视为合作伙伴而非快捷工具,并将其整合到软件交付的全生命周期中。
NVIDIA研究团队开发出名为Lyra的AI系统,能够仅凭单张照片生成完整3D场景,用户可自由切换观察角度。该技术采用创新的"自蒸馏"学习方法,让视频生成模型指导3D重建模块工作。系统还支持动态4D场景生成,在多项测试中表现优异。这项技术将大大降低3D内容创作门槛,为游戏开发、电影制作、VR/AR应用等领域带来重大突破。
Salesforce发布企业级AI智能体平台Agentforce 360,将AI智能体融入几乎所有应用中。该平台采用混合推理引擎Atlas,结合大语言模型的概率思维和业务规则的精确性,支持语音交互和深度集成。以Slack为主要界面,提供Agentforce Builder开发环境,能将非结构化文档转换为可查询记录。Salesforce内部已部署该系统,每周处理180万次对话,主动服务活动增长40%。
谷歌DeepMind团队创新性地让Gemini 2.5模型在无需训练的情况下学会理解卫星多光谱图像。他们将复杂的12波段卫星数据转换为6张可理解的伪彩色图像,配以详细文字说明,使通用AI模型能够准确分析遥感数据。在多个基准测试中超越现有模型,为遥感领域AI应用开辟了全新道路。