ZD至顶网软件频道消息(文/邹大斌):数据也是企业的资产,这种说法正在被广泛认同。在进入互联网时代,随着越多越多的企业在利用各种各样的数据来开展自己的业务,数据的价值日益凸显出来。然而,对于一个具有一定规模的企业,数据的利用都是一个非常头疼的问题。其中最大的一个问题之一就是“数出多门”。
“数出多门”的根本原因在于,多年的信息化建设让企业拥有的多套应用系统有些企业甚至有上百套的应用系统),每套系统上线时间不同,服务的业务部门不同,都有自己的一套数据。归属于不同业务系统中的数据有很多是重复或者是关联的,当然,也有些是相互矛盾的,比如同一个人可能出现在不同系统,但其联系方式(如电话)可能并不同。为了避免这问题,不少企业选择建立一个平台来集中统一管理和存储这些数据,这个平台就被称为主数据管理系统(MDM)。
实际上,保证数据的一致性只是主数据管理的多种功能中的一个。除此之外,主数据管理还可以确保数据的有效性、可管理性、质量和合规性。通俗地说就是,主数据管理相当于对企业的数据做一次全面的数据盘点和规整,多余的、重复的、矛盾的数据理清了,同时制定一个规则,确保以后的数据都是高质量的。
“现在流行顶层设计的说法,其实,在企业中上一套主数据管理系统就相当于给企业的数据来一次顶层设计,借此对企业的数据进行标准化和规范化。” 主数据管理专家、Informatica大中国区首席产品顾问但彬告诉ZD至顶网记者。
尽管目前MDM很流行,但实际上目前关于何谓主数据和主数据管理系统并没有一个统一的说法。根据Gartner的定义,主数据具有如下特点:关键的业务实体;一般是物理存在的;具有权威的一致性的标识;具有扩展的共有属性;具有数据层次和关系。常见的主数据包括客户、机构、产品、合同、项目等。而主数据管理系统则是一系列工具和处理过程,用以确保企业主数据的质量、意义。目前主数据管理系统最常见的应用领域是客户关系管理、产品生产和采购等领域。比如主数据管理与客户关系管理结合可以大幅改善客户体验,提高生产效率。
这是Informatica的MDM在一个寿险公司中的应用案例。过去这家公司的数据分别存储在不同的业务系统中,没有整合和关联。比如,某一个客户同时在这个公司购买了多种保险,有的是给自己买的,也有给家人买的。这些信息没有关联起来,没有形成一个有关该客户的完整统一的视图;另外,一旦客户信息发生变动,并没有反应到所有系统中,造成了数据的不一致。通过实施主数据管理项目,这家公司实现了全公司客户信息的统一集成和单一识别,构建起了一个实时、完整、共享和准确的客户统一视图。市场和营销人员可以根据客户端额特征、行为和偏好来实现个性化的客户关怀和服务,进而获取新客户,促进产品创新,提高交叉销售以及向上销售的能力。
但彬表示,近年来随着数据价值被越来越多的人认可,对MDM感兴趣的企业也是越来越多。同样,市场同类产品也比较多。大体分为两类,一类是从行业应用软件成长起来,比如CRM领域的,其MDM产品强在客户管理上;而从制造行业出来的,其MDM可能强在产品管理上;另一类提供通用平台的,就像Informatica这样的厂商。他认为,两类各有优缺点,前一类是开箱即用,但产品定制能力弱;而后一类复杂性,但更容易满足定制化的需求。
“总体上,通用MDM平台能够提供更为全面的可升级的解决方案,可以统一管理客户、产品、机构等多域主数据。另一个很重要的是,能和客户业务同步成长。” 但彬说。
但彬特别提醒说,大多数时候MDM项目涉及面都比较广,比较复杂,周期短则3个月长则一年。MDM项目的成功除了MDM软件以外,服务商还要有相应的最佳实践,企业也需要相应的流程保证。
好文章,需要你的鼓励
这项由索非亚大学INSAIT和苏黎世联邦理工学院共同完成的研究,揭示了大语言模型在数学定理证明中普遍存在的"迎合性"问题。研究团队构建了BrokenMath基准测试集,包含504道精心设计的错误数学命题,用于评估主流AI模型能否识别并纠正错误陈述。
约翰斯·霍普金斯大学研究团队提出了创新的隐私保护AI文本生成方法,通过"控制代码"系统指导AI生成虚假敏感信息来替代真实数据。该方法采用"藏身于众"策略,在医疗法律等敏感领域测试中实现了接近零的隐私泄露率,同时保持了高质量的文本生成效果,为高风险领域的AI应用提供了实用的隐私保护解决方案。
实验室和真实使用测试显示,iPhone Air电池续航能够满足一整天的典型使用需求。在CNET进行的三小时视频流媒体压力测试中,iPhone Air仅消耗15%电量,表现与iPhone 15相当。在45分钟高强度使用测试中表现稍逊,但在实际日常使用场景下,用户反馈iPhone Air能够稳定支撑全天使用,有线充电速度也比较理想。
这项由Reactive AI提出的稀疏查询注意力机制通过减少查询头数量而非键值头数量,直接降低了注意力层的计算复杂度,实现了2-3倍的训练和编码加速。该方法在长序列处理中表现出色,在20万词汇序列上达到3.5倍加速,且模型质量损失微乎其微,为计算密集型AI应用提供了新的优化路径。