ZDNet至顶网软件频道消息: 4月16日,IBM与北京中电广通科技有限公司(中电广通股份有限公司的控股子公司,以下简称广通科技)共同签署了“IBM-中电广通SaaS全面合作”备忘录,就未来共同合作交付SaaS(软件即服务)云计算服务达成战略合作协议。双方希望根据国内用户的需求在IBM全球已有的100多种SaaS云应用中尽快落地十余种。目前广通科技已经就IBM的Cometrics营销分析软件、人力资本管理软件Kenexa和移动解决方案Cyberlink等几种SaaS应用开始在国内市场上做验错性试验。
图注:IBM软件集团大中华区渠道部总经理许伟利(前左)和北京中电广通科技有限公司总经理郭雪梅女士(前右)在IBM软件集团全球渠道副总裁Mark Register、IBM软件集团创新业务部总经理何怡静女士(左一)以及北京中电广通科技有限公司副总经理陆涛(右二)等嘉宾的见证下握手签约。(蒋湘辉 摄)
IBM软件集团大中华区渠道部总经理许伟利在回答ZDNet记者提问时表示,“云计算是IBM公司2014年三大重点业务之一,其中SaaS是IBM云计算业务中的重要组成部分。目前IBM在全球已有100多种SaaS云应用,其中约有六七十种软件已有中文版本,IBM和中电广通科技有望根据国内用户的需求先落地其中的十几个SaaS应用。”
北京中电广通科技有限公司总经理郭雪梅女士则表示,双方将通过进一步调动各自在市场、技术、产品、行业经验、服务和本地资源等方面优势,针对中国客户特有需求共建SaaS解决方案服务团队。“广通科技和IBM将成立管理团队和执行团队,尽快能够让IBM SaaS业务在中国落地、生根、发芽。目前广通科技已经就IBM的Cometrics营销分析软件、人力资本管理软件Kenexa和移动解决方案Cyberlink等几种软件开始在国内市场上做验错性试验,未来的一两个月我们还将针对IBM的十余种软件进行验错,之后我们将和IBM一道进行市场推广。广通科技目前已经配备了约50位专家型团队将充实到未来IBM软件的SaaS实施中。”郭雪梅向ZDNet记者透露。
据悉,成立于2004年的广通科技曾是IBM Power服务器在国内的重要合作伙伴,在全国的客户总数超过两千家,遍布于能源、金融、电信、政府、制造、流通等各大重点行业。该公司从2010年起在北京总部开始建设面向客户及合作伙伴开放的云计算数据中心,而通过与IBM SaaS的战略合作,广通科技也希望实现自身从渠道商向云计算服务商的转型。郭雪梅还表示,“2013年,我们的箱体式数据中心入选了IBM GTS亚太区唯一一个代理商,能够向IBM GTS部门全球范围内实现箱体式数据中心的供货。2014年我们准备在北京交付使用投入运营一个规模达4000个机架的云计算数据中心。”
郭雪梅还告诉ZDNet记者,“未来IBM在国内的SaaS用户可以自己选择将数据放在哪一个数据中心上,广通科技的云计算数据中心,IBM的SoftLayer以及其它数据中心都可以是选项。”
好文章,需要你的鼓励
亚利桑那州立大学的研究团队开发了RefEdit,这是一种新型图像编辑AI系统,能够准确理解和处理指代表达(如"中间那个人"、"右边的猫")。通过创建RefEdit-Bench基准测试,研究者们证明现有模型在多物体场景中表现不佳。他们设计了一种创新的数据生成流程,仅用2万样本就训练出的RefEdit模型超越了使用数百万样本训练的大型模型。这一突破使AI图像编辑在复杂场景中更加精确和实用。
这项研究提出了Critique-GRPO,一种创新的在线强化学习框架,将自然语言批评与数字反馈相结合,克服了传统仅用数字反馈的三大局限:性能瓶颈、自我反思效果有限和顽固性失败。实验表明,该方法使大语言模型能够从错误中学习并改进,在八项数学和通用推理任务中,将Qwen2.5-7B和Qwen3-8B模型的平均通过率分别提高了约4.5%和5%,超越了包括那些引入专家示范的方法。研究还揭示,高熵探索和长回答并不总是最有效的学习方式,质量更重要。这一方法为大语言模型的自我提升能力开辟了新路径。
这篇研究介绍了"量化LLM评价者",一个创新框架,能使大型语言模型(LLM)在评估其他AI输出时更接近人类判断。由麻省理工和Adobe联合研发的这一方法,将评估过程分为两个阶段:先让LLM生成文本评价,再用轻量级机器学习模型将这些评价转化为更准确的数值评分。研究提出了四种评价者模型,适用于不同评估场景,实验表明它们不仅能显著提高评分准确性,还比传统微调方法更节省计算资源。这一框架特别适合人类反馈有限的场景,为AI评估领域开辟了高效且可解释的新路径。
这项研究由IDEA、华南理工大学和北京大学联合开发的Rex-Thinker系统,通过模仿人类的链式思考方式来解决物体指代问题。与传统直接输出边界框的方法不同,它采用规划-行动-总结的三步骤推理,使AI能像人类一样逐步分析图像中的候选物体,并在找不到匹配物体时拒绝作答。通过构建90,824样本的HumanRef-CoT数据集和两阶段训练方法,系统在精度、可解释性和泛化能力上均取得了显著进步。