IBM正在不断提升其数据质量能力,今天宣布将收购一家名为Databand.ai的公司,交易金额未对外公布。
Databand.ai是一家数据可观察性软件的提供商,其软件可以帮助企业解决任何数据相关问题,例如错误、管道故障和质量差等问题。
IBM表示,当企业越来越依赖大量信息为业务决策提供支撑的同时,数据质量也变成了企业面临的一个大问题,企业需要一种方法来了解系统中数据的健康状况,以便他们能够在这些问题影响业务之前就发现问题并对其进行修复。
所谓“坏数据”是指不准确或者不完整的数据可能会导致人工智能系统和用于评估特定产品需求的预测模型等服务出现巨大的问题。如果导入这种系统中的数据存在缺陷,那么由此生成的结果就是不可信的,因此就需要数据可观察性工具来确保信息的质量不受影响。
对于大型企业来说,坏数据是一个大问题。据Gartner估计,企业组织平均每年在解决坏数据问题上的花费高达1290万美元。
Databand.ai是数据可观察性领域的一个领先者,它使用历史趋势来计算有关数据工作负载和数据管道的统计数据,以确定这些数据是否被恰当使用以及是否可能存在问题。IBM表示,Databand.ai采用了一种开放且可扩展的数据可观察性方法,可以轻松集成到现有数据基础设施中。
IBM计划将Databand.ai的工具和IBM Observability by Instana APM以及IBM Watson Studio等服务相结合,增强在数据可观察性领域的现有能力。例如,Databand.ai可以提醒团队出现数据不完整或数据缺失等问题。
然后,该团队可以使用Instana找出丢失数据的来源,以及导致应用或服务出现故障的原因。IBM表示,通过同时使用这两种工具,客户可以更全面地了解应用基础设施和数据管道,从而更容易解决任何问题。
Constellation Research分析师Dough Henschen解释说,坏数据对企业来说仍然是一个非常现实的挑战,主要问题之一就是随着生成数据的系统发生变化或故障,“好数据也会变成坏数据”。
“数据可观察性是一种不断发展变化的方法,其中信息不仅仅是作为准备或转换过程的一部分被清理,相反,它会持续地监控和跟踪数据质量,并主动提醒下游系统的所有者、管理者和用户采取预防或补救措施,以便在动态环境中出现问题时让数据质量回归正轨。”
IBM公司数据和人工智能总经理Daniel Hernandez表示,IBM有很多客户都是数据驱动型企业,他们依靠高质量的、可信赖的信息来为他们的关键任务流程和应用提供动力。
Hernandez说:“如果他们无法访问所需的数据,业务可能就会陷入停滞。随着Databand.ai的加入,IBM将为IT跨应用、数据和机器学习提供最全面的可观察性功能组合。”
这家位于以色列特拉维夫的公司将归属于IBM数据和人工智能业务部门,该部门还包括了IBM Watson和IBM Cloud Pak for Data,Databand.ai的工具将以软件即服务或者自托管软件订阅的方式提供给客户。
好文章,需要你的鼓励
Birk Jernstrom在Shopify收购其上一家初创公司后,创立了货币化平台Polar,专注帮助开发者构建单人独角兽企业。该平台为开发者提供支付基础设施服务,处理全球计费和税务问题,让企业从第一天起就能销售在线产品和SaaS订阅服务。Polar获得了Accel领投的1000万美元种子轮融资,自2024年9月推出以来已吸引1.8万名客户。
Anthropic和Open Philanthropy研究人员发现,之前声称AI推理模型存在"准确率崩溃"的研究实际上混淆了推理能力和物理限制。通过重新分析发现,AI模型在遇到输出长度限制时会主动停止,而非推理失败;部分测试题目本身无解却被当作失败案例;改用程序生成方式后,模型在复杂问题上表现出色,揭示了AI评估方法的重要缺陷。
OpenAI首席执行官奥特曼证实,Meta为挖角OpenAI和谷歌DeepMind的顶尖AI研究人员,开出了超过1亿美元的薪酬包。然而,这些挖角努力基本失败。奥特曼表示,员工们认为OpenAI在实现AGI方面机会更大,公司文化更注重创新使命而非高薪。Meta正在组建超级智能团队,但面临OpenAI、Anthropic等竞争对手的激烈竞争。
华为联合多所高校发布TeleMath数据集,这是首个专门评估大型语言模型在通信数学问题求解能力的基准测试。研究团队设计创新的合成数据生成框架,从50个专家问题扩展至500个测试样本,涵盖信号处理、网络优化等七大领域。评估结果显示,专门的推理模型明显优于通用模型,为通信AI应用指明方向。