IBM正在不断提升其数据质量能力,今天宣布将收购一家名为Databand.ai的公司,交易金额未对外公布。
Databand.ai是一家数据可观察性软件的提供商,其软件可以帮助企业解决任何数据相关问题,例如错误、管道故障和质量差等问题。
IBM表示,当企业越来越依赖大量信息为业务决策提供支撑的同时,数据质量也变成了企业面临的一个大问题,企业需要一种方法来了解系统中数据的健康状况,以便他们能够在这些问题影响业务之前就发现问题并对其进行修复。
所谓“坏数据”是指不准确或者不完整的数据可能会导致人工智能系统和用于评估特定产品需求的预测模型等服务出现巨大的问题。如果导入这种系统中的数据存在缺陷,那么由此生成的结果就是不可信的,因此就需要数据可观察性工具来确保信息的质量不受影响。
对于大型企业来说,坏数据是一个大问题。据Gartner估计,企业组织平均每年在解决坏数据问题上的花费高达1290万美元。
Databand.ai是数据可观察性领域的一个领先者,它使用历史趋势来计算有关数据工作负载和数据管道的统计数据,以确定这些数据是否被恰当使用以及是否可能存在问题。IBM表示,Databand.ai采用了一种开放且可扩展的数据可观察性方法,可以轻松集成到现有数据基础设施中。
IBM计划将Databand.ai的工具和IBM Observability by Instana APM以及IBM Watson Studio等服务相结合,增强在数据可观察性领域的现有能力。例如,Databand.ai可以提醒团队出现数据不完整或数据缺失等问题。
然后,该团队可以使用Instana找出丢失数据的来源,以及导致应用或服务出现故障的原因。IBM表示,通过同时使用这两种工具,客户可以更全面地了解应用基础设施和数据管道,从而更容易解决任何问题。
Constellation Research分析师Dough Henschen解释说,坏数据对企业来说仍然是一个非常现实的挑战,主要问题之一就是随着生成数据的系统发生变化或故障,“好数据也会变成坏数据”。
“数据可观察性是一种不断发展变化的方法,其中信息不仅仅是作为准备或转换过程的一部分被清理,相反,它会持续地监控和跟踪数据质量,并主动提醒下游系统的所有者、管理者和用户采取预防或补救措施,以便在动态环境中出现问题时让数据质量回归正轨。”
IBM公司数据和人工智能总经理Daniel Hernandez表示,IBM有很多客户都是数据驱动型企业,他们依靠高质量的、可信赖的信息来为他们的关键任务流程和应用提供动力。
Hernandez说:“如果他们无法访问所需的数据,业务可能就会陷入停滞。随着Databand.ai的加入,IBM将为IT跨应用、数据和机器学习提供最全面的可观察性功能组合。”
这家位于以色列特拉维夫的公司将归属于IBM数据和人工智能业务部门,该部门还包括了IBM Watson和IBM Cloud Pak for Data,Databand.ai的工具将以软件即服务或者自托管软件订阅的方式提供给客户。
好文章,需要你的鼓励
在我们的日常生活中,睡眠的重要性不言而喻。一个晚上没睡好,第二天的工作效率就会大打折扣,而充足的睡眠不仅能让我们恢复精力,还能帮助大脑整理和巩固当天学到的知识。有趣的是,AI模型竟然也表现出了类似的“睡眠需求”。
DeepSeek-AI团队通过创新的软硬件协同设计,仅用2048张GPU训练出性能卓越的DeepSeek-V3大语言模型,挑战了AI训练需要海量资源的传统观念。该研究采用多头潜在注意力、专家混合架构、FP8低精度训练等技术,大幅提升内存效率和计算性能,为AI技术的民主化和可持续发展提供了新思路。
尽管模型上下文协议(MCP)自11月推出以来用户数量快速增长,但金融机构等监管行业仍保持谨慎态度。银行等金融服务公司虽然在机器学习和算法方面是先驱,但对于MCP和Agent2Agent(A2A)系统的采用较为保守。监管企业通常只使用内部代理,因为其API集成需要经过多年审查以确保合规性和安全性。专家指出,MCP缺乏基本构建块,特别是在互操作性、通信标准、身份验证和审计跟踪方面。金融机构需要确保代理能够进行"了解您的客户"验证,并具备可验证的身份识别能力。
加拿大女王大学研究团队首次系统评估了大型视频语言模型的因果推理能力,发现即使最先进的AI在理解视频中事件因果关系方面表现极差,大多数模型准确率甚至低于随机猜测。研究创建了全球首个视频因果推理基准VCRBench,并提出了识别-推理分解法(RRD),通过任务分解显著提升了AI性能,最高改善幅度达25.2%。