至顶网软件频道消息: 亚马逊(Amazon.com Inc.)希望用自己最新推出的硬件让开发人员亲身体验深度学习。星期三,在拉斯维加斯举办的AWS re:Invent大会上,该公司发布了AWS DeepLens,这是一款无线摄像头,开发人员可以用它运行深度学习和图形识别模型。
DeepLens摄像头是亚马逊网络服务公司(Amazon Web Services Inc.)和英特尔公司合作的成果,为各种技能级别的开发人员提供必要的工具以创建人工智能和机器学习产品。这是AWS努力将机器学习带给大量开发人员的另一个范例。
随着机器学习在各种消费产品——包括智能手机和安全摄像头——中的增长,AWS DeepLens可以帮助开发者进一步创新。DeepLens的零售价将定为249美元, 并将于4月14日开始出货, 但现在已经开放预订。目前仅在美国销售。
AWS DeepLens的工作方式将和谷歌的Clips摄像头类似,Clips是一款支持人工智能的免手工操作摄像头,是由这家科技巨头在10月份推出的。Clips摄像头的零售价也将定在249美元,但是发布日期仍然没有确定。不过Clips针对的是消费者市场,而DeepLens则是专门针对开发人员市场的。
英特尔的人工智能产品副总裁兼总经理Naveen Rao表示,“现在你有了一个平台,我们可以在这里开发特定用例。”他表示,“把摄像头看成是云的延展。它不是一个产品,它是一个平台。”
AWS DeepLens硬件和软件
无线可编程 DeepLens 设备使用了一个4百万像素的摄像头, 可以捕获视频1,080p 高清分辨率视频并能通过2D 麦克风阵列捕捉音频。该设备配备了英特尔 Atom X5 处理器并包含了8GB内存和16GB 存储空间。这款紧凑型设备还包括各种端口,包括microSD、微型 HDMI 和两个 USB 端口。
在软件方面, 它运行 Ubuntu 16.04, 并预装了 AWS Greengrass, 软件将云功能扩展到本地设备。它可以使用开源人工智能服务, 如谷歌的 TensorFlow 和 Facebook Inc. 的Caffe 2, 以及 AWS 的新 SageMaker——它也是在re:Invent上推出的。
亚马逊 SageMaker是一种能够简化人工智能模型部署的服务,并且提供了挑选AWS预设模型的选项,开发人员也可以根据不同的标准训练他们自己的模型。
DeepLens 预训练的模型
AWS的首席执行官Andy Jassy表示,DeepLens可以通过编程做“几乎任何事情”,包括在摄像头识别出特定牌照时自动打开车库的大门以及在发现狗跳上了沙发时发出警报。
虽然开发人员可以创建自己的深度学习模型,并让Amazon SageMaker对其进行培训,他们也可以使用DeepLens预培训模型库。然后只需要点击一下就可以把模型部署到DeepLens上, 开发人员可以实时在AWS 管理控制台中查看结果。
AWS 预训练模型提供了各种图像检测和识别, 包括面部,、猫和狗和无生命的对象, 例如耳机和植物、以及热狗 ("将你的食物按照热狗和非热狗进行分类",这是一个流行的互联网文化)。预训练的模型还可以识别30多种活动, 包括刷牙和弹吉他。
好文章,需要你的鼓励
在TechCrunch Disrupt大会上,三位投资人分享了优秀融资演示的制胜秘诀。他们强调,创业者应避免过度使用AI等流行词汇,重点关注三个核心问题:市场规模是否足够大、创始人是否具备独特优势、是否有客户验证。对于AI初创企业,投资人建议要有明确的领域专业知识和竞争策略,诚实面对竞争对手,专注于产品构建而非概念炒作。
新加坡国立大学联合Lovart AI开发的OmniPSD系统,首次实现了AI驱动的双向PSD文件处理能力。该系统能够将扁平图像自动分解为可编辑的图层结构,同时支持从文字描述直接生成分层设计文件。基于扩散变换器架构和创新的RGBA-VAE技术,OmniPSD在20万真实设计样本上训练,实现了专业级的透明度处理和图层分解效果,为设计行业的数字化转型提供了强大工具。
苹果在iOS 14.5中推出的应用跟踪透明度功能要求开发者获得用户许可才能共享数据。用户可选择"允许"或"要求应用不跟踪"。选择后者会阻止应用访问IDFA标识符,但开发者仍可通过IP地址等其他方式跟踪用户。该功能推出后,可跟踪用户比例从73%降至18%,迫使广告商转向设备指纹识别等替代方案。
ByteDance Seed团队提出UniUGP统一框架,首次将自动驾驶的理解、生成、规划三大能力完美融合。通过混合专家架构和四阶段训练策略,该系统在场景理解、轨迹规划和视频生成等任务上均超越现有先进模型,为自动驾驶技术发展开辟了新路径,预示着更智能可靠的无人驾驶未来。