IBM正在不断提升其数据质量能力,今天宣布将收购一家名为Databand.ai的公司,交易金额未对外公布。
Databand.ai是一家数据可观察性软件的提供商,其软件可以帮助企业解决任何数据相关问题,例如错误、管道故障和质量差等问题。
IBM表示,当企业越来越依赖大量信息为业务决策提供支撑的同时,数据质量也变成了企业面临的一个大问题,企业需要一种方法来了解系统中数据的健康状况,以便他们能够在这些问题影响业务之前就发现问题并对其进行修复。
所谓“坏数据”是指不准确或者不完整的数据可能会导致人工智能系统和用于评估特定产品需求的预测模型等服务出现巨大的问题。如果导入这种系统中的数据存在缺陷,那么由此生成的结果就是不可信的,因此就需要数据可观察性工具来确保信息的质量不受影响。
对于大型企业来说,坏数据是一个大问题。据Gartner估计,企业组织平均每年在解决坏数据问题上的花费高达1290万美元。
Databand.ai是数据可观察性领域的一个领先者,它使用历史趋势来计算有关数据工作负载和数据管道的统计数据,以确定这些数据是否被恰当使用以及是否可能存在问题。IBM表示,Databand.ai采用了一种开放且可扩展的数据可观察性方法,可以轻松集成到现有数据基础设施中。
IBM计划将Databand.ai的工具和IBM Observability by Instana APM以及IBM Watson Studio等服务相结合,增强在数据可观察性领域的现有能力。例如,Databand.ai可以提醒团队出现数据不完整或数据缺失等问题。
然后,该团队可以使用Instana找出丢失数据的来源,以及导致应用或服务出现故障的原因。IBM表示,通过同时使用这两种工具,客户可以更全面地了解应用基础设施和数据管道,从而更容易解决任何问题。
Constellation Research分析师Dough Henschen解释说,坏数据对企业来说仍然是一个非常现实的挑战,主要问题之一就是随着生成数据的系统发生变化或故障,“好数据也会变成坏数据”。
“数据可观察性是一种不断发展变化的方法,其中信息不仅仅是作为准备或转换过程的一部分被清理,相反,它会持续地监控和跟踪数据质量,并主动提醒下游系统的所有者、管理者和用户采取预防或补救措施,以便在动态环境中出现问题时让数据质量回归正轨。”
IBM公司数据和人工智能总经理Daniel Hernandez表示,IBM有很多客户都是数据驱动型企业,他们依靠高质量的、可信赖的信息来为他们的关键任务流程和应用提供动力。
Hernandez说:“如果他们无法访问所需的数据,业务可能就会陷入停滞。随着Databand.ai的加入,IBM将为IT跨应用、数据和机器学习提供最全面的可观察性功能组合。”
这家位于以色列特拉维夫的公司将归属于IBM数据和人工智能业务部门,该部门还包括了IBM Watson和IBM Cloud Pak for Data,Databand.ai的工具将以软件即服务或者自托管软件订阅的方式提供给客户。
好文章,需要你的鼓励
邻里社交应用Nextdoor推出重新设计版本,新增本地新闻、实时警报和名为"Faves"的AI功能,用于发现本地商户和地点。该应用与3500家本地出版商合作提供新闻内容,通过Samdesk和Weather.com提供天气、交通、停电等实时警报。Faves功能利用15年邻里对话数据训练的大语言模型,为用户提供本地化AI推荐服务,帮助用户找到最佳餐厅、徒步地点等本地信息。
Skywork AI推出的第二代多模态推理模型R1V2,通过创新的混合强化学习方法,成功解决了AI"慢思考"策略在视觉推理中的挑战。该模型在保持强大推理能力的同时有效控制视觉幻觉,在多项权威测试中超越同类开源模型,某些指标甚至媲美商业产品,为开源AI发展树立了新标杆。
英国生物银行完成了世界上最大规模的全身成像项目,收集了10万名志愿者的超过10亿次扫描数据,用于研究人体衰老和疾病过程。该项目历时11年,每次扫描耗时5小时,投资6200万英镑。目前已有8万人的成像数据供全球研究人员使用,剩余数据将于年底前发布。项目已开发出能预测38种常见疾病的AI工具,并在心脏病、痴呆症和癌症诊断方面取得突破。
这项由北京大学等多所高校联合完成的研究,首次对OpenAI GPT-4o的图像生成能力进行了全面评估。研究团队设计了名为GPT-ImgEval的综合测试体系,从文本转图像、图像编辑和知识驱动创作三个维度评估GPT-4o,发现其在所有测试中都显著超越现有方法。研究还通过技术分析推断GPT-4o采用了自回归与扩散相结合的混合架构,并发现其生成图像仍可被现有检测工具有效识别,为AI图像生成领域提供了重要的评估基准和技术洞察。