至顶网软件频道消息: 亚马逊(Amazon.com Inc.)希望用自己最新推出的硬件让开发人员亲身体验深度学习。星期三,在拉斯维加斯举办的AWS re:Invent大会上,该公司发布了AWS DeepLens,这是一款无线摄像头,开发人员可以用它运行深度学习和图形识别模型。
DeepLens摄像头是亚马逊网络服务公司(Amazon Web Services Inc.)和英特尔公司合作的成果,为各种技能级别的开发人员提供必要的工具以创建人工智能和机器学习产品。这是AWS努力将机器学习带给大量开发人员的另一个范例。
随着机器学习在各种消费产品——包括智能手机和安全摄像头——中的增长,AWS DeepLens可以帮助开发者进一步创新。DeepLens的零售价将定为249美元, 并将于4月14日开始出货, 但现在已经开放预订。目前仅在美国销售。
AWS DeepLens的工作方式将和谷歌的Clips摄像头类似,Clips是一款支持人工智能的免手工操作摄像头,是由这家科技巨头在10月份推出的。Clips摄像头的零售价也将定在249美元,但是发布日期仍然没有确定。不过Clips针对的是消费者市场,而DeepLens则是专门针对开发人员市场的。
英特尔的人工智能产品副总裁兼总经理Naveen Rao表示,“现在你有了一个平台,我们可以在这里开发特定用例。”他表示,“把摄像头看成是云的延展。它不是一个产品,它是一个平台。”
AWS DeepLens硬件和软件
无线可编程 DeepLens 设备使用了一个4百万像素的摄像头, 可以捕获视频1,080p 高清分辨率视频并能通过2D 麦克风阵列捕捉音频。该设备配备了英特尔 Atom X5 处理器并包含了8GB内存和16GB 存储空间。这款紧凑型设备还包括各种端口,包括microSD、微型 HDMI 和两个 USB 端口。
在软件方面, 它运行 Ubuntu 16.04, 并预装了 AWS Greengrass, 软件将云功能扩展到本地设备。它可以使用开源人工智能服务, 如谷歌的 TensorFlow 和 Facebook Inc. 的Caffe 2, 以及 AWS 的新 SageMaker——它也是在re:Invent上推出的。
亚马逊 SageMaker是一种能够简化人工智能模型部署的服务,并且提供了挑选AWS预设模型的选项,开发人员也可以根据不同的标准训练他们自己的模型。
DeepLens 预训练的模型
AWS的首席执行官Andy Jassy表示,DeepLens可以通过编程做“几乎任何事情”,包括在摄像头识别出特定牌照时自动打开车库的大门以及在发现狗跳上了沙发时发出警报。
虽然开发人员可以创建自己的深度学习模型,并让Amazon SageMaker对其进行培训,他们也可以使用DeepLens预培训模型库。然后只需要点击一下就可以把模型部署到DeepLens上, 开发人员可以实时在AWS 管理控制台中查看结果。
AWS 预训练模型提供了各种图像检测和识别, 包括面部,、猫和狗和无生命的对象, 例如耳机和植物、以及热狗 ("将你的食物按照热狗和非热狗进行分类",这是一个流行的互联网文化)。预训练的模型还可以识别30多种活动, 包括刷牙和弹吉他。
好文章,需要你的鼓励
AI颠覆预计将在2026年持续,推动企业适应不断演进的技术并扩大规模。国际奥委会、Moderna和Sportradar的领导者在纽约路透社峰会上分享了他们的AI策略。讨论焦点包括自建AI与购买第三方资源的选择,AI在内部流程优化和外部产品开发中的应用,以及小型模型在日常应用中的潜力。专家建议,企业应将AI建设融入企业文化,以创新而非成本节约为驱动力。
字节跳动等机构联合发布GAR技术,让AI能同时理解图像的全局和局部信息,实现对多个区域间复杂关系的准确分析。该技术通过RoI对齐特征重放方法,在保持全局视野的同时提取精确细节,在多项测试中表现出色,甚至在某些指标上超越了体积更大的模型,为AI视觉理解能力带来重要突破。
Spotify在新西兰测试推出AI提示播放列表功能,用户可通过文字描述需求让AI根据指令和听歌历史生成个性化播放列表。该功能允许用户设置定期刷新,相当于创建可控制算法的每周发现播放列表。这是Spotify赋予用户更多控制权努力的一部分,此前其AI DJ功能也增加了语音提示选项,反映了各平台让用户更好控制算法推荐的趋势。
Inclusion AI团队推出首个开源万亿参数思维模型Ring-1T,通过IcePop、C3PO++和ASystem三项核心技术突破,解决了超大规模强化学习训练的稳定性和效率难题。该模型在AIME-2025获得93.4分,IMO-2025达到银牌水平,CodeForces获得2088分,展现出卓越的数学推理和编程能力,为AI推理能力发展树立了新的里程碑。