至顶网软件频道消息: 亚马逊(Amazon.com Inc.)希望用自己最新推出的硬件让开发人员亲身体验深度学习。星期三,在拉斯维加斯举办的AWS re:Invent大会上,该公司发布了AWS DeepLens,这是一款无线摄像头,开发人员可以用它运行深度学习和图形识别模型。
DeepLens摄像头是亚马逊网络服务公司(Amazon Web Services Inc.)和英特尔公司合作的成果,为各种技能级别的开发人员提供必要的工具以创建人工智能和机器学习产品。这是AWS努力将机器学习带给大量开发人员的另一个范例。
随着机器学习在各种消费产品——包括智能手机和安全摄像头——中的增长,AWS DeepLens可以帮助开发者进一步创新。DeepLens的零售价将定为249美元, 并将于4月14日开始出货, 但现在已经开放预订。目前仅在美国销售。
AWS DeepLens的工作方式将和谷歌的Clips摄像头类似,Clips是一款支持人工智能的免手工操作摄像头,是由这家科技巨头在10月份推出的。Clips摄像头的零售价也将定在249美元,但是发布日期仍然没有确定。不过Clips针对的是消费者市场,而DeepLens则是专门针对开发人员市场的。
英特尔的人工智能产品副总裁兼总经理Naveen Rao表示,“现在你有了一个平台,我们可以在这里开发特定用例。”他表示,“把摄像头看成是云的延展。它不是一个产品,它是一个平台。”
AWS DeepLens硬件和软件
无线可编程 DeepLens 设备使用了一个4百万像素的摄像头, 可以捕获视频1,080p 高清分辨率视频并能通过2D 麦克风阵列捕捉音频。该设备配备了英特尔 Atom X5 处理器并包含了8GB内存和16GB 存储空间。这款紧凑型设备还包括各种端口,包括microSD、微型 HDMI 和两个 USB 端口。
在软件方面, 它运行 Ubuntu 16.04, 并预装了 AWS Greengrass, 软件将云功能扩展到本地设备。它可以使用开源人工智能服务, 如谷歌的 TensorFlow 和 Facebook Inc. 的Caffe 2, 以及 AWS 的新 SageMaker——它也是在re:Invent上推出的。
亚马逊 SageMaker是一种能够简化人工智能模型部署的服务,并且提供了挑选AWS预设模型的选项,开发人员也可以根据不同的标准训练他们自己的模型。
DeepLens 预训练的模型
AWS的首席执行官Andy Jassy表示,DeepLens可以通过编程做“几乎任何事情”,包括在摄像头识别出特定牌照时自动打开车库的大门以及在发现狗跳上了沙发时发出警报。
虽然开发人员可以创建自己的深度学习模型,并让Amazon SageMaker对其进行培训,他们也可以使用DeepLens预培训模型库。然后只需要点击一下就可以把模型部署到DeepLens上, 开发人员可以实时在AWS 管理控制台中查看结果。
AWS 预训练模型提供了各种图像检测和识别, 包括面部,、猫和狗和无生命的对象, 例如耳机和植物、以及热狗 ("将你的食物按照热狗和非热狗进行分类",这是一个流行的互联网文化)。预训练的模型还可以识别30多种活动, 包括刷牙和弹吉他。
好文章,需要你的鼓励
香港大学和加州大学伯克利分校的一项新研究显示,在没有人工标注数据的情况下,语言模型和视觉语言模型能够更好地泛化。这一发现挑战了大型语言模型社区的主流观点,即模型需要手工标注的训练样本。研究表明,过度依赖人工示例反而可能对模型的泛化能力产生负面影响。
OpenAI 发布了一款名为 Operator 的网络自动化工具,该工具使用名为计算机使用代理 (CUA) 的新 AI 模型来控制网络浏览器。Operator 通过视觉界面观察和交互屏幕元素,模仿人类操作方式执行任务。这项技术目前仍处于研究预览阶段,OpenAI 希望通过用户反馈来改进系统功能。
大型语言模型如 ChatGPT 展现了对话能力,但它们并不真正理解所使用的词汇。研究者们在冲绳科学技术大学构建了一个受大脑启发的人工智能模型,虽然其学习能力有限,但似乎掌握了词汇背后的概念。通过模仿婴儿学习语言的方式,研究团队将人工智能训练在一个能够与世界互动的机器人中,探索如何让人工智能实现类似人类的语言理解。