计算和软件巨头IBM和SAP SE今天分别公布了多个项目,旨在让大型企业更容易地在他们的运营中使用深度学习,这些举措也表明深度学习神经网络正在步入主流。
深度学习神经网络试图模拟大脑的学习方式,让计算机自己学习而不是被明确编程。近些年,该方法已经在语音和图像识别方面取得了巨大进步,从Amazon Alexa数字助理到自动驾驶汽车的方方面面。
但是到目前为止,大多数深度学习的坚定支持者都是大型的互联网公司,例如Google、Facebook和微软。目前还没有太多大型企业在他们自己的核心应用中广泛使用这项技术。
IBM高性能计算和机器学习副总裁Sumit Gupta表示:“深度学习对企业而言正在变得越来越有趣。所有对人工智能的兴趣都是有深度学习推动的。”
机会是巨大的。根据来自Tractica公司的2016年度报告,全球深度学习软件年收入将从2015年的1.09亿美元增长到2024年的104亿美元,这意味着到2024年,在该企业市场的累计支持将达到406亿美元。
IBM和SAP在利用深度学习方面并不孤单。Google、Facebook、微软、Saleforce.com等企业多年来一直利用神经网络来强化他们自身的服务,并实现新的技术创新。但是目前,企业正在他们自己的应用中寻求好处,而这正是IBM和SAP,以及Google和微软等云提供商,希望提供的。
今天,IBM宣布将结合两组软件工具,旨在让企业更容易将AI技术运用于企业的运营中。IBM的Data Science Experiece是一个协作工作空间,可帮助数据科学家管理数据和训练机器学习模型。现在Data Science与IBM PowerAI深度学习平台相结合,后者提供了一系列开源软件框架例如TensorFlow、Caffe以及Torch,能够做图像和语音识别、自然语言处理以及类似需要长时间学习的任务。
此举的目的是让数据科学家针对各种任务更轻松地利用深度学习。例如,银行可以更准确地预测客户是否可能违约贷款或者检测信用卡欺诈。制造商可以利用历史机器数据来训练模型,在发生之前识别出潜在故障。此外还可以根据POS数据、天气和其他外部数据来优化库存管理。Gupta表示:“数据科学家不必在配置或者管理服务器上花费太多心思。”
Data Science Experience将在云和内部部署环境中提供,但是PowerAI只在内部部署环境中提供。所以这个集成软件只针对内部部署的数据中心,目前还没有关于云版本的明确计划。
另一方面,SAP在今天宣布将成为在采用Nvidia最新一代Volta GPU的计算机系统上提供企业机器学习技术组合的公司。GPU芯片通常用于游戏和其他图形密集的场景,因为可以并行处理大量数据、且远比传统处理器快得多而成为深度学习的标配。
Nvidia GPU最早于2016年安装在位于以色列和德国波兹坦的Nvidia DGX-1系统中,随后安装在SAP位于德国圣莱昂罗特的生产数据中心,以及位于加州帕洛阿尔托和新加坡的创新实验室中。目前,Nvidia GPU已经为SAP Leonardo机器学习软件组合的数据和算法训练提供支撑。
现在,SAP将升级自己位于圣莱昂罗特的数据中心,采用Nvidia的Volta系统,Nvidia公司副总裁、DGX计算总经理Jim McHugh表示,这是首个面向企业的Volta生产解决方案。SAP机器学习副总裁Markus Noga表示:“我们一直致力于为企业应用用户提供深度学习和人类层面智能性的好处。”
例如,SAP的Brand Impact是一项基于云的机器学习服务,可分析视频以检测品牌标识,以及在电影和电视中的曝光来确定广告效果。现在这项服务可以在24小时内提供分析,而以前手动操作需要6周时间。
SAP还有Machine Learning服务,以及客户服务票、客户发票与付款匹配、一个自动化应付账款系统原型。Noga表示,SAP计划从明年开始把这些服务扩展到主流企业资源规划应用例如核心财务、采购和生产等。
目前,在Volta系统上的Leonardo Machine Learning组合仅在云中提供,不过Noga表示,SAP正在准备内部部署的版本。
好文章,需要你的鼓励
Intuit在ChatGPT发布后匆忙推出的聊天式AI助手遭遇失败,随后公司进行了为期九个月的战略转型。通过观察客户实际工作流程,发现手动转录发票等重复性劳动,决定用AI智能体自动化这些任务而非强加新的聊天行为。公司建立了三大支柱框架:培养构建者文化、高速迭代替代官僚主义、构建GenOS平台引擎。最终推出的QuickBooks支付智能体让小企业平均提前5天收到款项,每月节省12小时工作时间。
希伯来大学研究团队开发出MV-RAG系统,首次解决了AI在生成稀有物品3D模型时的"胡编乱造"问题。该系统像拥有图像记忆库的艺术家,能先搜索相关真实照片再生成准确3D视图。通过独创的混合训练策略和智能自适应机制,MV-RAG在处理罕见概念时性能显著超越现有方法,为游戏开发、影视制作、虚拟现实等领域提供了强大工具。
马斯克旗下xAI公司发布专为开发者设计的新AI模型grok-code-fast-1,主打快速且经济的推理能力。该模型属于Grok 4系列,具备自主处理任务的能力。xAI声称其在SWE-bench评测中解决了70.8%的实际软件问题,表现优于GPT-5和Claude 4。不过模型存在较高的不诚实率问题。用户可通过GitHub Copilot等平台免费试用7天,需要API密钥访问。
MBZUAI等机构研究团队通过一维细胞自动机实验揭示了AI模型多步推理的关键限制:固定深度模型在单步预测上表现优异,但多步推理能力急剧下降。研究发现增加模型深度比宽度更有效,自适应计算时间、强化学习和思维链训练能突破这些限制。这为开发更强推理能力的AI系统提供了重要指导,强调了真正推理与简单记忆的本质区别。