AWS正在向自己的云平台中增加更多新的功能,帮助开发者更有效地编写代码,并为AI项目生成训练数据集。这些功能于近日在美国拉斯维加斯举行的Amazon re:MARS 2022大会上首次亮相。
AI驱动的编码助手
AWS云产品组合的首个新增功能,是一项名为Amazon CodeWhisperer的服务,该服务目前处于预览阶段,使用AI自动生成软件代码。据AWS称,这项服务通过自动生成原本必须手动的代码,为开发者节省时间,从而更快速地完成软件项目。
AWS表示,已经用来自开源项目、内部代码库和其他来源的数十亿行代码对CodeWhisperer进行了训练。该服务能够一次性生成超过10行代码,还可以匹配给定软件项目的编码风格,从而简化某些开发任务。
“CodeWhisperer利用多个上下文线索来生成建议,包括源代码中的光标位置、光标之前的代码、同一项目中其他文件的注释和代码,”AWS首席布道师Jeff Barr详细介绍说。
软件团队可以使用AWS IDE Toolkit工具访问Code Whisperer,该工具旨在与开发者的集成开发环境或IDE集成(IDE是程序员用来编写代码和执行相关任务的一种桌面应用)。CodeWhisperer支持多个主流IDE以及多种编程语言,包括Java、JavaScript和Python。
CodeWhisperer可以根据开发者添加到源文件的自然语言文本生成代码片段。如果开发者输入“检查数字是否为质数”之类的指令,CodeWhisperer就可以生成执行指定任务的代码片段。如果完成一项任务需要利用云服务或库等外部技术,CodeWhisperer则可以自动找到必要的技术并将其整合到代码中。
CodeWhisperer服务的另一个重点是让开发者更容易使用AWS云平台,它简化了在AWS Amazon S3存储服务中创建存储桶或数据存储库等任务,此外也适用于其他服务例如Amazon EC2和AWS Lambda。
简化AI训练
除了CodeWhisperer之外,AWS还更新了SageMaker Ground Truth服务。该服务可以帮助软件团队为AI项目创建训练数据集,此次更新加入了合成数据生成功能。
构建AI应用涉及到很多步骤,其中最耗时的步骤之一就是准备训练数据集,可能需要长达数月的时间,因为这通常需要手动创建数据,例如,如果一家公司正在构建一个神经网络来检测生产线上的故障组件,就必须创建一个包含了故障组件图像的自定义训练数据集。
AWS人工智能和机器学习首席开发者布道师Antje Barth在一篇博客文章中解释说:“一旦你收集了所有数据,就需要准确地标记图像,这本身就是一项艰巨的任务。手动标记图像很慢,并且容易出现人为错误,构建自定义标记工具和设置缩放标记操作可能是既耗时又耗费成本的。”
据AWS称,此次更新SageMaker Ground Truth将简化这项任务,AWS可以帮助企业创建一个合成的训练数据集,加快AI开发速度,这种合成训练数据集是专门为AI开发目的而生成的文件集合。
Barth详细介绍说:“AWS数字艺术家将首先创建一小批带标签的合成图像作为试制,供你查看。一旦准备好,就可以使用逼真的物理引擎进行渲染,通过虚拟世界中的传感器捕获场景图像,图像也是自动标记的。”
新的合成数据生成功能和CodeWhisperer服务扩展了AWS已经相当广泛的AI产品组合。AWS提供了多种旨在简化神经网络开发的服务,还通过Amazon Personalize等产品提供预打包的机器学习功能,用于自动生成产品推荐。
好文章,需要你的鼓励
火箭实验室(Rocket Lab)宣布计划以现金加股票方式,斥资80亿美元收购主要卫星运营商铱星通信(Iridium Communications),交易预计于2027年中完成。铱星目前运营着由66颗活跃低轨卫星组成的星座网络,拥有约255万活跃用户,2024年营收达8.717亿美元。收购完成后,Rocket Lab计划借助其新型重型运载火箭Neutron及Lightning卫星平台,扩大铱星星座规模,开拓未被覆盖的市场并降低发射成本。
腾讯等机构提出ViQ框架,通过两阶段渐进量化训练,让离散视觉编码在多模态理解和图像重建上同时追平连续特征编码器,训练速度最高提升70%。
音乐流媒体平台Tidal宣布,将于7月中旬启用自动化工具,对完全由AI生成的音乐添加"AI"标识,并移除具有欺诈性质的曲目。平台还将取消AI生成音乐的版税资格,仅向真人创作、演唱的原创音乐开放变现渠道。此外,Tidal明确将高频异常上传、干扰真实艺术家等行为列为欺诈活动。Deezer、Spotify等竞争对手此前已推出类似检测机制,流媒体行业正加速构建AI内容治理体系。
香港科技大学与华为联合提出LISA训练方法,通过让副网络对齐"似然分数",将ControlNet等图像生成模型的训练收敛速度提升逾2.78倍,同时改善图像质量与条件控制精度。