问鼎“最强AI”，Claude 3 支持20万Token输入性能吊打GPT-4 原创

作者：赵晓勤

刚刚，Anthropic 丢出一颗“王炸”，声称其Claude 3 Opus模型在基准测试上优于 OpenAI 的 GPT-4 和 Google 的 Gemini 1.0 Ultra，三个版本均支持20万Token输入并成为“最接近人”应答的大模型。

Claude 3 系列模型有三个版本：Claude 3 Haiku 轻便快捷、Claude 3 Sonnet 是技巧与速度的最佳结合以及性能最强大的 Claude 3 Opus。

问鼎“最强AI”，Claude 3 支持20万Token输入性能吊打GPT-4

Claude 3主打安全无害

Anthropic是由前 OpenAI 研究高管创立，拥有包括谷歌、Salesforce 和亚马逊云科技在内的支持者，并在过去一年完成了五笔不同的融资交易，融资总额达到了 73 亿美元。

Claude 3大模型不同于GPT-4与Gemini ，Anthropic 希望打造安全的人工智能系统，并能让人们能可靠地部署，通过在数据对齐方面的努力，追求从人类的反馈中进行强化学习，以培养出一个有益无害的助手。

Anthropic认为人工智能是一门系统科学。为此他们开发了标度定律（scaling laws）。这是受到在统计物理学中标度普遍性的启发。Anthropic发现 Transformer语言模型中性能与训练时间、上下文长度、数据集大小、模型大小和计算预算等因素之间存在精确的幂律关系。通过使用足够小的批次大小时所需的计算量预测，并且这对于理解语言模型的性能和优化计算资源分配具有重要意义。

安全性的研究则更为重要。技术的迭代让人们每次都会看到比以往性能更好、更大的模型和网络。这些更大的网络也带来了新的安全挑战。Anthropic更加关注大型模型的安全问题，以便找到使其更可靠的方法，并提高整个领域的安全部署结果。Anthropic当前的重点是原型系统，将这些安全技术与分析文本和代码的工具相结合。因此，在Claude 2 有时会过度拒绝，Claude 3 对提示的理解更加细致。

Anthropic高度重视项目合作，并致力于自上而下和自下而上的研究规划相结合。Anthropic非常重视让每个人——研究人员、工程师、社会影响专家和政策分析师——都参与到确定这一方向中来。希望与其他实验室和研究人员合作，因为我们相信，表征这些系统的最佳研究将来自广泛的研究人员群体。

为了让模型有益无害，Anthropic利用一种方法，通过收集人类偏好数据并应用偏好建模（Preference Modeling，PMing）和从人类反馈中强化学习（Reinforcement Learning from Human Feedback，RLHF）的技术来训练出一种相对有助且无害的自然语言助理。

强大的性能超越 OpenAI和 Google

Claude Opus 是最智能的模型，在人工智能系统的大多数常见评估基准上都优于同行，包括本科水平专家知识 (MMLU)、研究生水平专家推理 (GPQA)、基础数学 (GSM8K) 等。它在复杂任务上表现出接近人类水平的理解力和流畅性，引领通用智能的前沿。

快速是其另一大优势。Claude 3 模型在20万上下文的巨大输入内容下也可快速应答问题。可以支持实时客户聊天、自动完成和数据提取任务，其中响应是立即且实时。Haiku 可以在不到三秒的时间内阅读 arXiv 上包含图表和图形的信息和数据密集的研究论文。

此外还具备强大视觉能力：他们可以处理各种视觉格式，包括照片、图表、图形和技术图表。我们特别高兴能够为我们的企业客户提供这种新模式，其中一些客户的知识库高达 50% 以各种格式编码，例如 PDF、流程图或演示幻灯片。

问鼎“最强AI”，Claude 3 支持20万Token输入性能吊打GPT-4

“风浪越大鱼越贵”在大语言模型领域也不例外。Anthropic 表示，Claude 3 Opus 收取每百万Token的数据的费用为 15 美元，而处理相同数据的较小模型的费用至少要低五倍。相比之下，OpenAI 对输入其 GPT-4 Turbo 模型的每百万Token收取 10 美元。

与云服务企业深入合作，帮助企业快速落地

大语言模型拥有具有巨大的商业潜力。大语言模型可以用于自然语言处理、智能对话系统、文本生成、翻译等多个领域。通过开发和推广大语言模型，企业可以为其产品和服务增加更强大的自然语言处理能力，从而提升用户体验，扩大市场份额。

谷歌云和亚马逊云科技都加入了对Claude 3 的支持与部署。

Google Cloud 云人工智能产品管理高级总监沃伦·巴克利表示：“ 为了增强客户的选择和创新能力 Google Cloud 通过在 Vertex AI 中提供的精选第一方、开源和第三方模型。Claude 3将在未来几周内在Vertex AI Model Garden中全面推出。”

Google Cloud 客户将能够通过Vertex AI Model Garden中的 API 访问从所有三个 Claude 3 模型中进行选择。

通过 Vertex AI 中的简单 API 调用快速访问 Claude 的预训练模型加速 AI 开发。使用户专注应用，而不是基础设施。付费更加灵活，通过按需付费优化成本。并利用 Google Cloud 的内置安全性、隐私性和合规性部署。

亚马逊云科技也迅速加入了对Claude 3系列模型的支持，并基于Amazon Bedrock提供服务。亚马逊云科技数据和AI副总裁Swami Sivasubramanian博士表示：“我们与Anthropic展开合作，旨在将领先的生成式AI技术带给全球客户，如在亚马逊云科技的先进基础设施（如AI芯片Amazon Trainium）上进行构建。我们很荣幸能够继往开来，在Amazon Bedrock上引入Claude 3模型。

用户将可以通过Amazon Bedrock访问Claude 3系列的三个支持视觉功能的模型——Claude 3 Opus、Claude 3 Sonnet和Claude 3 Haiku。其中Sonnet模型现已在美东（北弗吉尼亚州）和美西（俄勒冈州）区域正式可用，Opus模型和Haiku模型将在未来数周内推出。

AI技术更新速度可谓是“日新月异”，科技企业为了不掉队，通过资本的方式投注新技术：因此我们看到了Google、亚马逊云科技、Meta这样的企业除了自研大模型还不断投资新兴的大模型创业公司。在需求端，企业面对快速的技术更迭，软件定义硬件的趋势更加明显，以往通过购买IT硬件再部署软件上线业务的模式恐将“一去不返”。取而代之的是根据应用需求，采取软硬件的订阅模式：硬件按需求、性能订阅算力、存储等云服务，软件也将在云上直接部署按Token付费。

来源：至顶网软件与服务频道

0赞

好文章，需要你的鼓励

问鼎“最强AI”，Claude 3 支持20万Token输入性能吊打GPT-4 原创

来源：至顶网软件与服务频道

2024

03/05

18:07

分享

点赞

AWS强化基础设施战略，全面升级SageMaker应对AI竞争

BigQuery如何融合数据与AI实现业务转型

智能时代，同球共济！2025世界人工智能大会将于7月26日启幕

AI催生下的价值迁徙，神州数码与阿里云合作的“生态位”再定义

铠侠UFS 4.1闪存承诺提升AI应用性能表现

Google Firebase Studio推出智能体模式实现自动化编程

谷歌为Veo 3增加图像转视频生成功能

英伟达计划推出专为中国市场设计的AI芯片

YouTube新政策旨在减少AI生成的低质量视频内容

Citrix重返主流虚拟化市场，但承认产品尚未就绪

Docker推出新功能支持AI智能体开发

欧盟AI新规让科技巨头深恶痛绝的条款

DeepSeek之后，中国人形机器人以“群体智能”再次掀起技术浪潮

QwQ-32B模型成本地部署福音，通义App可第一时间体验

入局智驾的印奇，看到了怎样的未来？

成本打到6万以下，手把手教你用4路锐炫显卡+至强W跑DeepSeek

千里科技亮相吉利AI智能科技发布会，共启“AI+车”新纪元

天翼云CPU实例部署DeepSeek-R1模型最佳实践

京东云与宝德计算战略签约，共绘分布式存储与智算新未来

性能狂飙70%！宝德 x 京东云AI存储一体机新品上市，重塑行业标杆

思科与英伟达扩大合作，助力企业加速应用AI技术

两位前谷歌软件工程师，用AI改写黑夜成像规则

如果您非常迫切的想了解IT领域最新产品与技术信息，那么订阅至顶网技术邮件将是您的最佳途径之一

AWS re:Inforce：费城这天不只拼进球，还拼生成式AI安全

在欧洲之门马德里，我们再次见证了SAP激活企业增长的“飞轮”

IEEE专家委员胡凝：消解AI幻觉“阴影”，洞见“超级个体”价值锚点

生成式AI催生新物种，SaaS CRM掀起下半场变革战

关注官方公众号

关注官方微博

关注官方喜马拉雅

友情链接

业界热点: