近日,亚马逊网络服务公司宣布位于阿布扎比的技术创新研究所(TII)已经在云提供商的基础架构上完成了大型语言模型Falcon 40B的训练。
这标志着AWS和TII之间合作的一个重要里程碑,AWS和TII都在试图拓展人工智能研究和开发的边界。Falcon 40B模型具有400亿个参数容量,具备很高的性能和准确度,在Hugging Face的Open LLM Leaderboard排行榜上拔得头筹。
现在可以通过Amazon SageMaker JumpStart使用Falcon 40B,据称它为希望使用最先进的语言模型而又不想自己从头开始进行搭建的企业和组织开辟了一种新的可能。客户可以通过Amazon SageMaker访问Falcon 40B,使用翻译、问题回答、总结和图像识别等功能。
2023年6月,人工智能成了最热门的东西,纳斯达克指数飙升,投资者的资金涌向任何拥有.AI域名或者声称在使用AI的公司。
AWS虽不是一家人工智能创业公司,但它紧密关注着人工智能和大型语言模型,并致力于成为该领域的领导者。随着Falcon 40B模型在AWS上训练成功,亚马逊证明自己正在致力于成为人工智能和LLM的领导者。
除了Falcon 40B的消息之外,AWS还宣布扩大与印度数字服务公司Persistent Systems的合作关系,后者主要服务于银行和金融服务业。
根据双方拓展的合作,Persistent Systems将使用Amazon CodeWhisperer,让其开发人员生成带有注释的代码,帮助他们绕过耗时的开发任务,加速创建新的解决方案。
2022年6月,亚马逊推出了CodeWhisperer,这是一项人工智能服务,可以提供编码帮助。AWS表示,它已经用来自开源项目、内部代码库和其他来源的数十亿行代码对CodeWhisperer进行了训练。该服务能够一次生成超过10行代码。
好文章,需要你的鼓励
前谷歌资深工程师David Petrou创立的AI初创公司Continua宣布完成800万美元种子轮融资,由GV领投。该公司开发AI智能体技术,可加入SMS、iMessage和Discord等群聊平台,为用户协作提供智能支持。Continua能够在群聊中自动设置提醒、发起投票、添加日历邀请或生成待办清单,解决群聊混乱问题。公司通过微调技术让AI理解群聊动态,具备社交智能,只在需要时提供帮助。
艾伦人工智能研究院开发的MolmoAct是首个开源的机器人空间推理模型,通过"看懂-规划-执行"三步思考法让机器人具备类人的空间理解能力。它不仅在多项基准测试中表现优异,还支持直观的视觉轨迹调教,用户可直接在屏幕上画线指导机器人行为。研究团队完全开源了模型、代码和数据集,为全球机器人研究提供强大基础平台。
Anthropic宣布为企业客户增加Claude单次提示词的信息处理量,以吸引更多开发者使用其AI编程模型。Claude Sonnet 4现支持100万token上下文窗口,可处理75万词或7.5万行代码的请求,是此前限制的5倍,超过OpenAI GPT-5的40万token。该功能也将通过Amazon Bedrock和Google Cloud等云合作伙伴提供。更大的上下文窗口有助于AI模型更好地处理软件工程问题和长期自主编程任务。
这项由北京大学和清华大学联合完成的研究首次提出时间自奖励语言模型,通过"锚定拒绝"和"未来引导选择"策略解决了AI自学习中的梯度消失问题。该方法让AI既能从过去的低水平样本中学习反面教材,又能向未来的高水平样本学习正面目标,成功维持了清晰的学习对比信号,在多个基准测试中显著优于传统自奖励方法。