近日,亚马逊网络服务公司宣布位于阿布扎比的技术创新研究所(TII)已经在云提供商的基础架构上完成了大型语言模型Falcon 40B的训练。
这标志着AWS和TII之间合作的一个重要里程碑,AWS和TII都在试图拓展人工智能研究和开发的边界。Falcon 40B模型具有400亿个参数容量,具备很高的性能和准确度,在Hugging Face的Open LLM Leaderboard排行榜上拔得头筹。
现在可以通过Amazon SageMaker JumpStart使用Falcon 40B,据称它为希望使用最先进的语言模型而又不想自己从头开始进行搭建的企业和组织开辟了一种新的可能。客户可以通过Amazon SageMaker访问Falcon 40B,使用翻译、问题回答、总结和图像识别等功能。
2023年6月,人工智能成了最热门的东西,纳斯达克指数飙升,投资者的资金涌向任何拥有.AI域名或者声称在使用AI的公司。
AWS虽不是一家人工智能创业公司,但它紧密关注着人工智能和大型语言模型,并致力于成为该领域的领导者。随着Falcon 40B模型在AWS上训练成功,亚马逊证明自己正在致力于成为人工智能和LLM的领导者。
除了Falcon 40B的消息之外,AWS还宣布扩大与印度数字服务公司Persistent Systems的合作关系,后者主要服务于银行和金融服务业。
根据双方拓展的合作,Persistent Systems将使用Amazon CodeWhisperer,让其开发人员生成带有注释的代码,帮助他们绕过耗时的开发任务,加速创建新的解决方案。
2022年6月,亚马逊推出了CodeWhisperer,这是一项人工智能服务,可以提供编码帮助。AWS表示,它已经用来自开源项目、内部代码库和其他来源的数十亿行代码对CodeWhisperer进行了训练。该服务能够一次生成超过10行代码。
好文章,需要你的鼓励
AWS通过升级SageMaker机器学习平台来扩展市场地位,新增观测能力、连接式编码环境和GPU集群性能管理功能。面对谷歌和微软的激烈竞争,AWS专注于为企业提供AI基础设施支撑。SageMaker新功能包括深入洞察模型性能下降原因、为开发者提供更多计算资源控制权,以及支持本地IDE连接部署。这些更新主要源于客户需求,旨在解决AI模型开发中的实际问题。
南洋理工大学研究团队开发了WorldMem框架,首次让AI拥有真正的长期记忆能力,解决了虚拟世界模拟中的一致性问题。该系统通过记忆银行存储历史场景,并使用智能检索机制,让AI能准确重现之前的场景和事件,即使间隔很长时间。实验显示在Minecraft和真实场景中都表现出色,为游戏、自动驾驶、机器人等领域带来广阔应用前景。
AI虽具备变革企业洞察力的潜力,但成功依赖于数据质量。大多数AI项目失败源于数据混乱分散而非算法局限。谷歌BigQuery云数据AI平台打破数据孤岛,简化治理,加速企业AI应用。通过AI自动化数据处理,实现实时分析,并与Vertex AI深度集成,使企业能够高效处理结构化和非结构化数据,将智能商业转型从愿景变为现实。
MTS AI研究团队提出RewardRanker系统,通过重排序模型和迭代自训练显著提升AI代码生成质量。该方法让13.4B参数模型超越33B大模型,在多种编程语言上表现优异,甚至在C++上超越GPT-4。通过引入困难负样本和PPO优化,系统能从多个代码候选中选出最优方案,为AI编程助手的实用化奠定基础。