IBM近日推出新的Granite系列语言模型阵容,该系列将作为IBM watsonx产品套件的一部分提供给用户。
Granite系列是与其他几个新功能一起推出的。据IBM称,watsonx将增加一款新的工具可以让企业更轻松地创建AI训练数据集,另一项新增功能则会让神经网络更容易适应新的任务。
IBM在今年5月推出了watsonx软件产品,旨在帮助企业构建生成式AI模型,并有望简化例如确保神经网络满足安全要求等相关任务。
IBM这次推出的Granite模型将通过watsonx一个名为watsonx.ai的组件提供给用户。据IBM公司称,后者提供的工具可以更轻松地构建定制神经网络。此外,Watsonx.ai还包括了一系列预先打包的AI模型,这些模型将在本季度晚些时候通过Granite系列得到增强。
Granite系列包括了两种语言模型,分别是Granite.13b.instruct和Granite.13b.chat。IBM 表示,这两种语言模型可以总结文档、执行“洞察提取”以及生成文本,是IBM工程师通过2.4 TB训练数据集构建的。
这两个Granite模型都有130亿个参数,这使其足够紧凑,可以运行在Nvidia单个V100 GPU上。V100比Nvidia的旗舰产品H100要便宜得多,因此从理论上讲,Granite系列应该比那些需要更复杂硬件才能运行的大型语言模型更容易部署。
IBM公司软件高级副总裁Dinesh Nirmal在今天的博客文章中这样写道:“最初的Granite模型只是一个开始:更多的模型还将采用其他语言,更多IBM训练的模型也在准备之中。”
除了Granite系列之后,IBM还在watsonx.ai上推出了两个开源AI模型。第一个是Llama-2,这是Meta Platforms的通用大型语言模型;以及StarCoder,这是ServiceNow和Hugging Face在5月份发布的针对编程任务优化的神经网络。
除了更大的预打包神经网络目录之外,最新版本的watsonx.ai还包括了新的人工智能开发功能。
创建自定义人工智能模型往往需要大量的训练数据。在很多情况下,手动聚合这些信息可能需要大量的时间和精力,企业简化这个工作流程的方法之一,就是使用软件自动生成训练数据。
众所周知,此类合成数据并不总是像手动创建的记录那么准确,但对于AI训练来说通常是适合的。
据IBM称,watsonx.ai将增加一个内置的合成数据生成工具。要使用该公司,企业就必须上传示例数据集,例如购买日志的集合,watson.ai可以分析这些日志并生成具有类似特征的综合记录。
让已经训练好的AI模型适应新的任务,这通常需要对其进行重新训练,而且这可能是一个资源密集型的过程。为了应对这一挑战,IBM为watsonx.ai配备了参数调整工具,该工具可以针对新任务优化神经网络,而无需重新训练。
开发人员通过参数调整创建第二个起到支持作用的神经网络来优化AI模型。第二个神经网络向AI模型提供如何执行给定任务的指令,当这些指令与用户的自然语言提示相结合的时候,AI就能够比其他方式更有效地执行手头上的任务。
IBM还详细介绍了有关于watsonx.data的增强,watsonx.data是watsonx产品套件的一个组件,旨在帮助企业管理他们的AI训练数据集。
据IBM称,该工具将增加对话界面,允许用户更轻松地可视化存储在watsonx.data中的信息,对其进行细化并查找特定记录。IBM还增加了一个经过优化以保存嵌入的矢量数据库,即AI模型用来存储其内部知识存储库的数学结构。
好文章,需要你的鼓励
苹果在iOS 26公开发布两周后推出首个修复更新iOS 26.0.1,建议所有用户安装。由于重大版本发布通常伴随漏洞,许多用户此前选择安装iOS 18.7。尽管iOS 26经过数月测试,但更大用户基数能发现更多问题。新版本与iPhone 17等新机型同期发布,测试范围此前受限。预计苹果将继续发布后续修复版本。
Queen's大学研究团队提出结构化智能体软件工程框架SASE,重新定义人机协作模式。该框架将程序员角色从代码编写者转变为AI团队指挥者,建立双向咨询机制和标准化文档系统,解决AI编程中的质量控制难题,为软件工程向智能化协作时代转型提供系统性解决方案。
据报道,OpenAI正准备发布一款由即将推出的Sora 2视频模型驱动的独立社交应用。该应用与TikTok高度相似,采用垂直视频信息流和滑动滚动导航。不过,该应用仅支持AI生成的内容,用户无法从手机相册上传照片或视频。Sora 2在应用内生成的视频时长限制为10秒或更短。应用还包含身份验证工具,允许用户使用自己的肖像生成视频,其他用户可以标记并在重新混合视频时使用他们的肖像。
西北工业大学与中山大学合作开发了首个超声专用AI视觉语言模型EchoVLM,通过收集15家医院20万病例和147万超声图像,采用专家混合架构,实现了比通用AI模型准确率提升10分以上的突破。该系统能自动生成超声报告、进行诊断分析和回答专业问题,为医生提供智能辅助,推动医疗AI向专业化发展。