AWS最近宣布,人工智能安全和研究公司Anthropic PBC将在Amazon Bedrock上提供自己的Claude 3系列模型。Claude 3 Sonnet和Claude 3 Haiku都已经在Bedrock上提供,今天Claude 3 Opus也已经全面向AWS客户推出。
AWS表示,这将可以帮助客户测试、构建和部署生成式AI应用。Amazon Bedrock内置了负责任的AI,提供了一系列完全托管的大型语言模型和基础模型,以及易用性功能,是构建和扩展生成式AI应用的最简单方法。
在此之前,AWS宣布在现有的Mistral 7B和Mixtral 8x7B 型号之外,新增支持法国领先的AI初创公司Mistral AI最新的、最先进的大型语言模型Mistral Large。客户可以使用Mistral AI的模型来总结和回答问题,凭借对文本结构和体系结构的深刻理解来帮助组织信息。与Mistral AI和Anthropic的合作巩固了AWS向各行业客户提供AI解决方案的承诺。
在Opus正式发布之前,AWS生成式AI副总裁Vasi Philomin和我们讨论了Bedrock,他说,访问多种类型的模型是一个明确的需求。
使用不同的模型
他说:“当你构建生成式AI应用的时候,你就需要访问不同的模型,仅仅一种模型是不够的,我们已经从客户那里清楚地了解到这一点。”他表示,AWS从一开始的立场就是提供最好的模型,并在Bedrock无服务器上提供这些模型,让客户可以进行实验和迭代。
Anthropic的这一新产品进一步丰富了Amazon Bedrock已经十分广泛的生成式AI模型,除了Anthropic现有的模型之外,还有AI21 Labs、Cohere、Meta Platforms、Mistral AI、Stability AI和Amazon的模型。
根据Anthropic称,Claude 3 Opus在推理、数学和编码方面优于其他可用模型,包括OpenAI的GPT-4。根据Anthropic的说法,Claude 3 Sonnet的速度是早期Claude模型的2倍,而且在此过程中也没有以牺牲智能性为代价。Claude 3 Haiku旨在提供近乎即时的响应,而且是三者中最实惠的。
这给那些不想被OpenAI的GPT-4 等特定模型锁定的用户提供了多种选择。但找到能够满足需求的恰当模型,可能是具有挑战的。Philomin声称,AWS已经解决了这个问题。
评估你需要什么
他说:“去年我们在re:Invent大会上公布了Bedrock本身模型评估功能的预览,这就是它让客户能够做到的事情:你进入Bedrock并选择你想要评估的模型。然后,对于你的应用,你需要一组提示来确定正在处理的应用类型,然后就可以根据提示对这些模型进行比较。”
他说,Bedrock中有两种模型评估方法。
“首先是自动化方法,我们有一堆预先填充的指标,这样客户就可以使用我们定义的指标,此外我们还有一些额外的公共数据集,如果他们想要使用的话。但是,理想情况下,他们应该拥有自己的数据集——也就是我谈到的提示内容。”
然后,客户使用自动评估功能来确定哪个模型更好。
让人类找出最合适的方案
“我始终相信,自动化评估会给你一种方向感,但最终你需要进行人工评估,以确定哪个更适合。因此,作为Bedrock模型评估能力的一部分,我们还会引入人工评估。”
这可能涉及企业员工针对与特定应用相关提示对模型输出进行审查和评级。他说,他们为此目的在Bedrock中构建了这些工作流程。AWS还有其他评估能力,但Philomin认为,大多数将依赖于模型评估能力。
一些要点
虽然微软已经走上了“单一模式统治一切的道路”,这非常“微软”,但AWS选择在开放和选择的基础上构建自己的AI战略,这是一条更长的、更具挑战性的道路,因为这突出了评估、测试和选择合适模型的能力,可能会带来更好的长期回报。如今,AWS拥有广泛的模型可供评估和测试,并且此次增加Anthropic的最新模型进一步强化了AWS的领先地位。
目前AWS有很多客户在使用Claude技术构建生成式AI应用,其中包括ADP、Amdocs、Bridgewater Associates、Dana-Farber Cancer Institute、Delta Air Lines、GoDaddy、Intuit、LexisNexis Legal & Professional、Pfizer、PGA TOUR和西门子。
GPT-4等模型非常有趣且功能强大,然而对于业务应用来说,可能是需要混合数据集的。Google最近宣布推出了Opus预览版,但Amazon Bedrock是唯一向客户提供所有三种Claude 3模型(Sonnet、Haiku和Opus)的服务,至少目前处于生成式AI的前沿位置。
好文章,需要你的鼓励
IDC数据显示,Arm架构服务器出货量预计2025年将增长70%,但仅占全球总出货量的21.1%,远低于Arm公司年底达到50%市场份额的目标。大规模机架配置系统如英伟达DGX GB200 NVL72等AI处理设备推动了Arm服务器需求。2025年第一季度全球服务器市场达到创纪录的952亿美元,同比增长134.1%。IDC将全年预测上调至3660亿美元,增长44.6%。配备GPU的AI服务器预计增长46.7%,占市场价值近半。
华为诺亚实验室联合多家顶尖院校推出开源机器人编程框架Ark,通过Python优先设计和模块化架构,实现仿真与现实环境的无缝切换。该框架大幅降低机器人编程门槛,支持现代AI技术集成,为机器人学习研究提供统一平台,有望加速机器人技术普及。
AI正在重塑创业公司的构建方式,这是自云计算出现以来最重大的变革。January Ventures联合创始人Jennifer Neundorfer将在TechCrunch All Stage活动中分享AI时代的新规则,涵盖从创意验证、产品开发到团队架构和市场策略的各个方面。作为专注于B2B早期投资的风投合伙人,她将为各阶段创业者提供关键洞察。
网易有道研究团队开发了Confucius3-Math,这是一个专门针对中国K-12数学教育的14B参数AI模型。该模型在多项数学推理测试中表现出色,超越了许多规模更大的竞争对手,训练成本仅需2.6万美元,推理速度比DeepSeek-R1快15倍,能在消费级GPU上高效运行,旨在通过降低AI教育成本来促进教育公平。