IBM发布全新Granite系列语言模型

IBM近日推出新的Granite系列语言模型阵容，该系列将作为IBM watsonx产品套件的一部分提供给用户。

Granite系列是与其他几个新功能一起推出的。据IBM称，watsonx将增加一款新的工具可以让企业更轻松地创建AI训练数据集，另一项新增功能则会让神经网络更容易适应新的任务。

IBM在今年5月推出了watsonx软件产品，旨在帮助企业构建生成式AI模型，并有望简化例如确保神经网络满足安全要求等相关任务。

IBM这次推出的Granite模型将通过watsonx一个名为watsonx.ai的组件提供给用户。据IBM公司称，后者提供的工具可以更轻松地构建定制神经网络。此外，Watsonx.ai还包括了一系列预先打包的AI模型，这些模型将在本季度晚些时候通过Granite系列得到增强。

Granite系列包括了两种语言模型，分别是Granite.13b.instruct和Granite.13b.chat。IBM 表示，这两种语言模型可以总结文档、执行“洞察提取”以及生成文本，是IBM工程师通过2.4 TB训练数据集构建的。

这两个Granite模型都有130亿个参数，这使其足够紧凑，可以运行在Nvidia单个V100 GPU上。V100比Nvidia的旗舰产品H100要便宜得多，因此从理论上讲，Granite系列应该比那些需要更复杂硬件才能运行的大型语言模型更容易部署。

IBM公司软件高级副总裁Dinesh Nirmal在今天的博客文章中这样写道：“最初的Granite模型只是一个开始：更多的模型还将采用其他语言，更多IBM训练的模型也在准备之中。”

除了Granite系列之后，IBM还在watsonx.ai上推出了两个开源AI模型。第一个是Llama-2，这是Meta Platforms的通用大型语言模型；以及StarCoder，这是ServiceNow和Hugging Face在5月份发布的针对编程任务优化的神经网络。

除了更大的预打包神经网络目录之外，最新版本的watsonx.ai还包括了新的人工智能开发功能。

创建自定义人工智能模型往往需要大量的训练数据。在很多情况下，手动聚合这些信息可能需要大量的时间和精力，企业简化这个工作流程的方法之一，就是使用软件自动生成训练数据。

众所周知，此类合成数据并不总是像手动创建的记录那么准确，但对于AI训练来说通常是适合的。

据IBM称，watsonx.ai将增加一个内置的合成数据生成工具。要使用该公司，企业就必须上传示例数据集，例如购买日志的集合，watson.ai可以分析这些日志并生成具有类似特征的综合记录。

让已经训练好的AI模型适应新的任务，这通常需要对其进行重新训练，而且这可能是一个资源密集型的过程。为了应对这一挑战，IBM为watsonx.ai配备了参数调整工具，该工具可以针对新任务优化神经网络，而无需重新训练。

开发人员通过参数调整创建第二个起到支持作用的神经网络来优化AI模型。第二个神经网络向AI模型提供如何执行给定任务的指令，当这些指令与用户的自然语言提示相结合的时候，AI就能够比其他方式更有效地执行手头上的任务。

IBM还详细介绍了有关于watsonx.data的增强，watsonx.data是watsonx产品套件的一个组件，旨在帮助企业管理他们的AI训练数据集。

据IBM称，该工具将增加对话界面，允许用户更轻松地可视化存储在watsonx.data中的信息，对其进行细化并查找特定记录。IBM还增加了一个经过优化以保存嵌入的矢量数据库，即AI模型用来存储其内部知识存储库的数学结构。

来源：至顶网软件与服务频道

0赞

好文章，需要你的鼓励

IBM发布全新Granite系列语言模型

来源：至顶网软件与服务频道

2023

09/08

18:09

分享

点赞

5060 Ti 16GB 跑本地 AI，真不如加钱买二手 3090？

散热为什么成了AI算力的“阀门”？

亚马逊 Mechanical Turk 将停止接受新用户注册

量子力学百年演进：从费解理论到改变世界的技术基石

Uber欧洲扩张计划遭遇阻碍，五国上线暂停

Claude Sonnet 5 发布：编码、推理与工具使用能力全面提升

AI高速扩张正悄然考验电网承载极限

福特对AI失望，重新雇用350名经验丰富的工程师

首批四家云服务商加入CISPE欧盟云主权认证计划

2026 Eurobike 展会：最值得关注的电动自行车与新奇产品盘点

联想Legion 7i Gen 10游戏本评测：颜值在线，性价比存疑

杀毒软件已不够用？全面了解现代网络安全防护

DeepSeek之后，中国人形机器人以“群体智能”再次掀起技术浪潮

QwQ-32B模型成本地部署福音，通义App可第一时间体验

入局智驾的印奇，看到了怎样的未来？

成本打到6万以下，手把手教你用4路锐炫显卡+至强W跑DeepSeek

千里科技亮相吉利AI智能科技发布会，共启“AI+车”新纪元

天翼云CPU实例部署DeepSeek-R1模型最佳实践

京东云与宝德计算战略签约，共绘分布式存储与智算新未来

性能狂飙70%！宝德 x 京东云AI存储一体机新品上市，重塑行业标杆

思科与英伟达扩大合作，助力企业加速应用AI技术

两位前谷歌软件工程师，用AI改写黑夜成像规则

如果您非常迫切的想了解IT领域最新产品与技术信息，那么订阅至顶网技术邮件将是您的最佳途径之一

三一集团：数字化是必选项，AI是生存项

因湃电池 × 达索系统：如何共创出一套电池产业最佳实践

AI走进真实世界之后：安全、健康与产业的新命题

CES 2026

关注官方公众号

关注官方微博

关注官方喜马拉雅

友情链接

业界热点: