近日,亚马逊网络服务公司宣布位于阿布扎比的技术创新研究所(TII)已经在云提供商的基础架构上完成了大型语言模型Falcon 40B的训练。
这标志着AWS和TII之间合作的一个重要里程碑,AWS和TII都在试图拓展人工智能研究和开发的边界。Falcon 40B模型具有400亿个参数容量,具备很高的性能和准确度,在Hugging Face的Open LLM Leaderboard排行榜上拔得头筹。
现在可以通过Amazon SageMaker JumpStart使用Falcon 40B,据称它为希望使用最先进的语言模型而又不想自己从头开始进行搭建的企业和组织开辟了一种新的可能。客户可以通过Amazon SageMaker访问Falcon 40B,使用翻译、问题回答、总结和图像识别等功能。
2023年6月,人工智能成了最热门的东西,纳斯达克指数飙升,投资者的资金涌向任何拥有.AI域名或者声称在使用AI的公司。
AWS虽不是一家人工智能创业公司,但它紧密关注着人工智能和大型语言模型,并致力于成为该领域的领导者。随着Falcon 40B模型在AWS上训练成功,亚马逊证明自己正在致力于成为人工智能和LLM的领导者。
除了Falcon 40B的消息之外,AWS还宣布扩大与印度数字服务公司Persistent Systems的合作关系,后者主要服务于银行和金融服务业。
根据双方拓展的合作,Persistent Systems将使用Amazon CodeWhisperer,让其开发人员生成带有注释的代码,帮助他们绕过耗时的开发任务,加速创建新的解决方案。
2022年6月,亚马逊推出了CodeWhisperer,这是一项人工智能服务,可以提供编码帮助。AWS表示,它已经用来自开源项目、内部代码库和其他来源的数十亿行代码对CodeWhisperer进行了训练。该服务能够一次生成超过10行代码。
好文章,需要你的鼓励
在“PEC 2025 AI创新者大会暨第二届提示工程峰会”上,一场以“AIGC创作新范式——双脑智能时代:心智驱动的生产力变革”为主题的分论坛,成为现场最具张力的对话空间。
人民大学团队开发了Search-o1框架,让AI在推理时能像侦探一样边查资料边思考。系统通过检测不确定性词汇自动触发搜索,并用知识精炼模块从海量资料中提取关键信息无缝融入推理过程。在博士级科学问题测试中,该系统整体准确率达63.6%,在物理和生物领域甚至超越人类专家水平,为AI推理能力带来突破性提升。
Linux Mint团队计划加快发布周期,在未来几个月推出两个新版本。LMDE 7代号"Gigi"基于Debian 13开发,将包含libAdapta库以支持Gtk4应用的主题功能。新版本将停止提供32位版本支持。同时Cinnamon桌面的Wayland支持持续改进,在菜单、状态小程序和键盘输入处理方面表现更佳,有望成为完整支持Wayland的重要桌面环境之一。
Anthropic研究团队开发的REINFORCE++算法通过采用全局优势标准化解决了AI训练中的"过度拟合"问题。该算法摒弃了传统PPO方法中昂贵的价值网络组件,用统一评价标准替代针对单个问题的局部基准,有效避免了"奖励破解"现象。实验显示,REINFORCE++在处理新问题时表现更稳定,特别是在长文本推理和工具集成场景中展现出优异的泛化能力,为开发更实用可靠的AI系统提供了新思路。