问鼎“最强AI”,Claude 3 支持20万Token输入性能吊打GPT-4 原创

刚刚,Anthropic 丢出一颗“王炸”,声称其Claude 3 Opus模型在基准测试上优于 OpenAI 的 GPT-4 和 Google 的 Gemini 1.0 Ultra, 三个版本均支持20万Token输入并成为“最接近人”应答的大模型。

刚刚,Anthropic 丢出一颗“王炸”,声称其Claude 3 Opus模型在基准测试上优于 OpenAI 的 GPT-4 和 Google 的 Gemini 1.0 Ultra, 三个版本均支持20万Token输入并成为“最接近人”应答的大模型。

Claude 3 系列模型有三个版本:Claude 3 Haiku 轻便快捷、Claude 3 Sonnet 是技巧与速度的最佳结合以及性能最强大的 Claude 3 Opus。

 

问鼎“最强AI”,Claude 3 支持20万Token输入性能吊打GPT-4 

Claude 3主打安全无害 

Anthropic是由前 OpenAI 研究高管创立,拥有包括谷歌、Salesforce 和亚马逊云科技在内的支持者,并在过去一年完成了五笔不同的融资交易,融资总额达到了 73 亿美元。 

Claude 3大模型不同于GPT-4与Gemini ,Anthropic 希望打造安全的人工智能系统,并能让人们能可靠地部署,通过在数据对齐方面的努力,追求从人类的反馈中进行强化学习,以培养出一个有益无害的助手。

Anthropic认为人工智能是一门系统科学。为此他们开发了标度定律(scaling laws)。这是受到在统计物理学中标度普遍性的启发。Anthropic发现 Transformer语言模型中性能与训练时间、上下文长度、数据集大小、模型大小和计算预算等因素之间存在精确的幂律关系。通过使用足够小的批次大小时所需的计算量预测,并且这对于理解语言模型的性能和优化计算资源分配具有重要意义。

安全性的研究则更为重要。技术的迭代让人们每次都会看到比以往性能更好、更大的模型和网络。这些更大的网络也带来了新的安全挑战。Anthropic更加关注大型模型的安全问题,以便找到使其更可靠的方法,并提高整个领域的安全部署结果。Anthropic当前的重点是原型系统,将这些安全技术与分析文本和代码的工具相结合。因此,在Claude 2 有时会过度拒绝,Claude 3 对提示的理解更加细致。

Anthropic高度重视项目合作,并致力于自上而下和自下而上的研究规划相结合。Anthropic非常重视让每个人——研究人员、工程师、社会影响专家和政策分析师——都参与到确定这一方向中来。希望与其他实验室和研究人员合作,因为我们相信,表征这些系统的最佳研究将来自广泛的研究人员群体。

为了让模型有益无害,Anthropic利用一种方法,通过收集人类偏好数据并应用偏好建模(Preference Modeling,PMing)和从人类反馈中强化学习(Reinforcement Learning from Human Feedback,RLHF)的技术来训练出一种相对有助且无害的自然语言助理。

强大的性能超越 OpenAI和 Google

Claude Opus 是最智能的模型,在人工智能系统的大多数常见评估基准上都优于同行,包括本科水平专家知识 (MMLU)、研究生水平专家推理 (GPQA)、基础数学 (GSM8K) 等。它在复杂任务上表现出接近人类水平的理解力和流畅性,引领通用智能的前沿。

问鼎“最强AI”,Claude 3 支持20万Token输入性能吊打GPT-4

快速是其另一大优势。Claude 3 模型在20万上下文的巨大输入内容下也可快速应答问题。可以支持实时客户聊天、自动完成和数据提取任务,其中响应是立即且实时。Haiku 可以在不到三秒的时间内阅读 arXiv 上包含图表和图形的信息和数据密集的研究论文。

此外还具备强大视觉能力:他们可以处理各种视觉格式,包括照片、图表、图形和技术图表。我们特别高兴能够为我们的企业客户提供这种新模式,其中一些客户的知识库高达 50% 以各种格式编码,例如 PDF、流程图或演示幻灯片。

问鼎“最强AI”,Claude 3 支持20万Token输入性能吊打GPT-4 

“风浪越大鱼越贵”在大语言模型领域也不例外。Anthropic 表示,Claude 3 Opus 收取每百万Token的数据的费用为 15 美元,而处理相同数据的较小模型的费用至少要低五倍。相比之下,OpenAI 对输入其 GPT-4 Turbo 模型的每百万Token收取 10 美元。

与云服务企业深入合作,帮助企业快速落地

大语言模型拥有具有巨大的商业潜力。大语言模型可以用于自然语言处理、智能对话系统、文本生成、翻译等多个领域。通过开发和推广大语言模型,企业可以为其产品和服务增加更强大的自然语言处理能力,从而提升用户体验,扩大市场份额。

谷歌云和亚马逊云科技都加入了对Claude 3 的支持与部署。

Google Cloud 云人工智能产品管理高级总监沃伦·巴克利表示:“ 为了增强客户的选择和创新能力 Google Cloud 通过在 Vertex AI 中提供的精选第一方、开源和第三方模型。Claude 3将在未来几周内在Vertex AI Model Garden中全面推出。”

Google Cloud 客户将能够通过Vertex AI Model Garden中的 API 访问从所有三个 Claude 3 模型中进行选择。

通过 Vertex AI 中的简单 API 调用快速访问 Claude 的预训练模型加速 AI 开发。使用户专注应用,而不是基础设施。付费更加灵活,通过按需付费优化成本。并利用 Google Cloud 的内置安全性、隐私性和合规性部署。

亚马逊云科技也迅速加入了对Claude 3系列模型的支持,并基于Amazon Bedrock提供服务。亚马逊云科技数据和AI副总裁Swami Sivasubramanian博士表示:“我们与Anthropic展开合作,旨在将领先的生成式AI技术带给全球客户,如在亚马逊云科技的先进基础设施(如AI芯片Amazon Trainium)上进行构建。我们很荣幸能够继往开来,在Amazon Bedrock上引入Claude 3模型。

用户将可以通过Amazon Bedrock访问Claude 3系列的三个支持视觉功能的模型——Claude 3 Opus、Claude 3 Sonnet和Claude 3 Haiku。其中Sonnet模型现已在美东(北弗吉尼亚州)和美西(俄勒冈州)区域正式可用,Opus模型和Haiku模型将在未来数周内推出。

AI技术更新速度可谓是“日新月异”,科技企业为了不掉队,通过资本的方式投注新技术:因此我们看到了Google、亚马逊云科技、Meta这样的企业除了自研大模型还不断投资新兴的大模型创业公司。在需求端,企业面对快速的技术更迭,软件定义硬件的趋势更加明显,以往通过购买IT硬件再部署软件上线业务的模式恐将“一去不返”。取而代之的是根据应用需求,采取软硬件的订阅模式:硬件按需求、性能订阅算力、存储等云服务,软件也将在云上直接部署按Token付费。

来源:至顶网软件与服务频道

0赞

好文章,需要你的鼓励

2024

03/05

18:07

分享

点赞

邮件订阅