ZD至顶网软件频道消息: SAP计划加强其机器学习和人工智能工作,希望其应用程序在自动化流程(如员工审批、支付处理和销售折扣)方面具有更广泛的影响力。
星期四,在纽约证券交易所,SAP介绍了该公司公有云版本的S/4 HANA企业资源规划套件。 ERP云套件有三个版本,专注于项目管理、财务和企业管理,并托管在SAP数据中心。
SAP S/4 HANA Cloud总裁Darren Roos在接受采访时表示,SAP确有计划支持其他公有云提供商,如Amazon Web Services、微软Azure和其他主要供应商的云平台。
但S/4 HANA公共云的做法有点偏离了SAP在人工智能和机器学习方面计划的路线图。在竞争对手和更广泛的企业技术生态系统已经主导了这个主题的时候,SAP才刚刚开始谈论机器学习和人工智能。
考虑一下:
Salesforce正在其整个产品组合中增加Einstein AI的功能。
Oracle有自适应智能应用程序。
公共云提供商,例如IBM、谷歌、AWS和微软都提供了重要的人工智能构建块。
人工智能四处蔓延——至少在市场营销中——简直是无处不在。
S/4 HANA的发布成了在纽约的召开的分析师会议的重点,会议对机器学习和人工智能路径图的关注和ERP一样多。SAP的首席执行官Bill McDermott在该公司第四季度财报电话会议上表达了对人工智能的关注。麦克德莫特对分析师们表示:
我们需要开始对我们已经在机器学习方面所做的一切打广告并开始市场营销。无论是招聘、员工审批、支付处理、销售折扣批准或呼叫中心管理,甚至包括有效使用机器人,我们都已经有了自己的机器学习解决方案,而且我们正在将其推广到整个行业。这将是一个巨大的增长源,可能没有被考虑到你的模型之中。
Roos承认SAP还没有敲响机器学习的战鼓。为什么?SAP想突出一些用例。Roos表示:“使用案例真的刚刚开始,无论是用机器学习匹配发票和付款以消除人为错误还是给用户如何匹配招聘和市场营销及预算的建议都是如此。” Roos表示,“我们已经在特定的机器学习用例上进行了投资。现实是机器学习没有任何真正的价值,除非你能够让它接触到用户和应用程序。”
SAP在人工智能方面采用的方法将围绕着通过其公共云产品为客户提供功能。SAP将开发自己的工具,但它也不会拒绝合作。Roos表示,“我不认为机器学习或人工智能能力的来源有什么重要的。SAP将合作利用人工智能和机器学习来增强我们的应用程序。”Roos表示,“我们也不会过多地考虑引擎来自何处,而是更重视它对客户的影响。”
好文章,需要你的鼓励
这项来自苹果公司的研究揭示了视频大语言模型评测的两大关键问题:许多测试问题不看视频就能回答正确,且打乱视频帧顺序后模型表现几乎不变。研究提出VBenchComp框架,将视频问题分为四类:语言模型可回答型、语义型、时序型和其他类型,发现在主流评测中高达70%的问题实际上未测试真正的视频理解能力。通过重新评估现有模型,研究团队证明单一总分可能掩盖关键能力差距,并提出了更高效的评测方法,为未来视频AI评测提供了新方向。
这篇来自KAIST AI研究团队的论文提出了"差分信息分布"(DID)这一创新概念,为理解直接偏好优化(DPO)提供全新视角。研究证明,当偏好数据编码了从参考策略到目标策略所需的差分信息时,DPO中的对数比率奖励形式是唯一最优的。通过分析DID熵,研究解释了对数似然位移现象,并发现高熵DID有利于通用指令跟随,而低熵DID适合知识密集型问答。这一框架统一了对DPO目标、偏好数据结构和策略行为的理解,为语言模型对齐提供理论支持。
VidText是一个全新的视频文本理解基准,解决了现有评估体系的关键缺口。它涵盖多种现实场景和多语言内容,提出三层评估框架(视频级、片段级、实例级),并配对感知与推理任务。对18个先进多模态模型的测试显示,即使最佳表现的Gemini 1.5 Pro也仅达46.8%平均分,远低于人类水平。研究揭示输入分辨率、OCR能力等内在因素和辅助信息、思维链推理等外部因素对性能有显著影响,为未来视频文本理解研究提供了方向。
ZeroGUI是一项突破性研究,实现了零人工成本下的GUI代理自动化在线学习。由上海人工智能实验室和清华大学等机构联合开发,这一框架利用视觉-语言模型自动生成训练任务并提供奖励反馈,使AI助手能够自主学习操作各种图形界面。通过两阶段强化学习策略,ZeroGUI显著提升了代理性能,在OSWorld环境中使UI-TARS和Aguvis模型分别获得14%和63%的相对改进。该研究彻底消除了传统方法对昂贵人工标注的依赖,为GUI代理技术的大规模应用铺平了道路。