至顶网软件频道消息: 亚马逊(Amazon.com Inc.)希望用自己最新推出的硬件让开发人员亲身体验深度学习。星期三,在拉斯维加斯举办的AWS re:Invent大会上,该公司发布了AWS DeepLens,这是一款无线摄像头,开发人员可以用它运行深度学习和图形识别模型。
DeepLens摄像头是亚马逊网络服务公司(Amazon Web Services Inc.)和英特尔公司合作的成果,为各种技能级别的开发人员提供必要的工具以创建人工智能和机器学习产品。这是AWS努力将机器学习带给大量开发人员的另一个范例。
随着机器学习在各种消费产品——包括智能手机和安全摄像头——中的增长,AWS DeepLens可以帮助开发者进一步创新。DeepLens的零售价将定为249美元, 并将于4月14日开始出货, 但现在已经开放预订。目前仅在美国销售。
AWS DeepLens的工作方式将和谷歌的Clips摄像头类似,Clips是一款支持人工智能的免手工操作摄像头,是由这家科技巨头在10月份推出的。Clips摄像头的零售价也将定在249美元,但是发布日期仍然没有确定。不过Clips针对的是消费者市场,而DeepLens则是专门针对开发人员市场的。
英特尔的人工智能产品副总裁兼总经理Naveen Rao表示,“现在你有了一个平台,我们可以在这里开发特定用例。”他表示,“把摄像头看成是云的延展。它不是一个产品,它是一个平台。”
AWS DeepLens硬件和软件
无线可编程 DeepLens 设备使用了一个4百万像素的摄像头, 可以捕获视频1,080p 高清分辨率视频并能通过2D 麦克风阵列捕捉音频。该设备配备了英特尔 Atom X5 处理器并包含了8GB内存和16GB 存储空间。这款紧凑型设备还包括各种端口,包括microSD、微型 HDMI 和两个 USB 端口。
在软件方面, 它运行 Ubuntu 16.04, 并预装了 AWS Greengrass, 软件将云功能扩展到本地设备。它可以使用开源人工智能服务, 如谷歌的 TensorFlow 和 Facebook Inc. 的Caffe 2, 以及 AWS 的新 SageMaker——它也是在re:Invent上推出的。
亚马逊 SageMaker是一种能够简化人工智能模型部署的服务,并且提供了挑选AWS预设模型的选项,开发人员也可以根据不同的标准训练他们自己的模型。
DeepLens 预训练的模型
AWS的首席执行官Andy Jassy表示,DeepLens可以通过编程做“几乎任何事情”,包括在摄像头识别出特定牌照时自动打开车库的大门以及在发现狗跳上了沙发时发出警报。
虽然开发人员可以创建自己的深度学习模型,并让Amazon SageMaker对其进行培训,他们也可以使用DeepLens预培训模型库。然后只需要点击一下就可以把模型部署到DeepLens上, 开发人员可以实时在AWS 管理控制台中查看结果。
AWS 预训练模型提供了各种图像检测和识别, 包括面部,、猫和狗和无生命的对象, 例如耳机和植物、以及热狗 ("将你的食物按照热狗和非热狗进行分类",这是一个流行的互联网文化)。预训练的模型还可以识别30多种活动, 包括刷牙和弹吉他。
好文章,需要你的鼓励
在Meta Connect大会上,Meta展示了新一代Ray-Ban智能眼镜的硬件实力,配备神经腕带支持手势控制,电池续航翻倍,摄像头性能提升。然而AI演示却频频失败,包括Live AI烹饪指导、WhatsApp通话和实时翻译功能都出现问题。尽管Meta在智能眼镜硬件方面表现出色,但AI软件仍远未达到扎克伯格提出的"超级智能"目标。文章建议Meta考虑开放AI生态,允许用户选择其他AI服务商,这可能帮助Meta在AI硬件市场获得优势。
人民大学团队开发了Search-o1框架,让AI在推理时能像侦探一样边查资料边思考。系统通过检测不确定性词汇自动触发搜索,并用知识精炼模块从海量资料中提取关键信息无缝融入推理过程。在博士级科学问题测试中,该系统整体准确率达63.6%,在物理和生物领域甚至超越人类专家水平,为AI推理能力带来突破性提升。
英伟达同意以50亿美元收购英特尔股份,双方将合作开发多代数据中心和PC产品。英伟达将以每股23.28美元的价格收购约4%的英特尔股份,成为其最大股东之一。两家公司将通过NVLink接口整合各自架构,实现CPU和GPU间的高速数据传输。英特尔将为英伟达AI平台定制x86处理器,并开发集成RTX GPU的x86系统级芯片,用于消费级PC市场。
Anthropic研究团队开发的REINFORCE++算法通过采用全局优势标准化解决了AI训练中的"过度拟合"问题。该算法摒弃了传统PPO方法中昂贵的价值网络组件,用统一评价标准替代针对单个问题的局部基准,有效避免了"奖励破解"现象。实验显示,REINFORCE++在处理新问题时表现更稳定,特别是在长文本推理和工具集成场景中展现出优异的泛化能力,为开发更实用可靠的AI系统提供了新思路。