至顶网软件频道消息: 亚马逊(Amazon.com Inc.)希望用自己最新推出的硬件让开发人员亲身体验深度学习。星期三,在拉斯维加斯举办的AWS re:Invent大会上,该公司发布了AWS DeepLens,这是一款无线摄像头,开发人员可以用它运行深度学习和图形识别模型。
DeepLens摄像头是亚马逊网络服务公司(Amazon Web Services Inc.)和英特尔公司合作的成果,为各种技能级别的开发人员提供必要的工具以创建人工智能和机器学习产品。这是AWS努力将机器学习带给大量开发人员的另一个范例。
随着机器学习在各种消费产品——包括智能手机和安全摄像头——中的增长,AWS DeepLens可以帮助开发者进一步创新。DeepLens的零售价将定为249美元, 并将于4月14日开始出货, 但现在已经开放预订。目前仅在美国销售。
AWS DeepLens的工作方式将和谷歌的Clips摄像头类似,Clips是一款支持人工智能的免手工操作摄像头,是由这家科技巨头在10月份推出的。Clips摄像头的零售价也将定在249美元,但是发布日期仍然没有确定。不过Clips针对的是消费者市场,而DeepLens则是专门针对开发人员市场的。
英特尔的人工智能产品副总裁兼总经理Naveen Rao表示,“现在你有了一个平台,我们可以在这里开发特定用例。”他表示,“把摄像头看成是云的延展。它不是一个产品,它是一个平台。”
AWS DeepLens硬件和软件
无线可编程 DeepLens 设备使用了一个4百万像素的摄像头, 可以捕获视频1,080p 高清分辨率视频并能通过2D 麦克风阵列捕捉音频。该设备配备了英特尔 Atom X5 处理器并包含了8GB内存和16GB 存储空间。这款紧凑型设备还包括各种端口,包括microSD、微型 HDMI 和两个 USB 端口。
在软件方面, 它运行 Ubuntu 16.04, 并预装了 AWS Greengrass, 软件将云功能扩展到本地设备。它可以使用开源人工智能服务, 如谷歌的 TensorFlow 和 Facebook Inc. 的Caffe 2, 以及 AWS 的新 SageMaker——它也是在re:Invent上推出的。
亚马逊 SageMaker是一种能够简化人工智能模型部署的服务,并且提供了挑选AWS预设模型的选项,开发人员也可以根据不同的标准训练他们自己的模型。
DeepLens 预训练的模型
AWS的首席执行官Andy Jassy表示,DeepLens可以通过编程做“几乎任何事情”,包括在摄像头识别出特定牌照时自动打开车库的大门以及在发现狗跳上了沙发时发出警报。
虽然开发人员可以创建自己的深度学习模型,并让Amazon SageMaker对其进行培训,他们也可以使用DeepLens预培训模型库。然后只需要点击一下就可以把模型部署到DeepLens上, 开发人员可以实时在AWS 管理控制台中查看结果。
AWS 预训练模型提供了各种图像检测和识别, 包括面部,、猫和狗和无生命的对象, 例如耳机和植物、以及热狗 ("将你的食物按照热狗和非热狗进行分类",这是一个流行的互联网文化)。预训练的模型还可以识别30多种活动, 包括刷牙和弹吉他。
好文章,需要你的鼓励
OpenAI在最新博客中首次承认,其AI安全防护在长时间对话中可能失效。该公司指出,相比短对话,长对话中的安全训练机制可能会退化,用户更容易通过改变措辞或分散话题来绕过检测。这一问题不仅影响OpenAI,也是所有大语言模型面临的技术挑战。目前OpenAI正在研究加强长对话中的安全防护措施。
北航团队推出VoxHammer技术,实现3D模型的精确局部编辑,如同3D版Photoshop。该方法直接在3D空间操作,通过逆向追踪和特征替换确保编辑精度,在保持未修改区域完全一致的同时实现高质量局部修改。研究还创建了Edit3D-Bench评估数据集,为3D编辑领域建立新标准,展现出在游戏开发、影视制作等领域的巨大应用潜力。
谷歌宣布计划到2026年底在弗吉尼亚州投资90亿美元,重点发展云计算和AI基础设施。投资包括在里士满南部切斯特菲尔德县建设新数据中心,扩建现有设施,并为当地居民提供教育和职业发展项目。弗吉尼亚州长表示这项投资是对该州AI经济领导地位的有力认可。此次投资是谷歌北美扩张战略的一部分。
宾夕法尼亚大学研究团队开发出PIXIE系统,这是首个能够仅通过视觉就快速准确预测三维物体完整物理属性的AI系统。该技术将传统需要数小时的物理参数预测缩短至2秒,准确率提升高达4.39倍,并能零样本泛化到真实场景。研究团队还构建了包含1624个标注物体的PIXIEVERSE数据集,为相关技术发展奠定了重要基础,在游戏开发、机器人控制等领域具有广阔应用前景。