作为EMC的企业数据治理高级总监,Barbara Latulippe 向 Potential at Work 社区讲述了她在制定企业数据质量和治理路线图方面的工作经历。 她提倡采取一种协作型、统一的方法来定义数据质量,并强调在所有业务部门(而不仅仅在 IT 与个别业务部门之间)开展合作的必要性。 凭借超过 25 年的 MDM 和企业应用系统实践经验,她对自己的上述见解确信无疑。
信息负责人如何与企业不同人员开展合作,以帮助他们定义数据质量?
Latulippe: 我们会设立自己的信息治理委员会,该委员会由不同业务部门以及不同职能部门参与。 我们不断努力为所有企业属性建立通用定义,这些定义一旦获得审批,我们就会将其纳入自己的业务词汇表中。 现在,可以说我们已经建立了一个通用定义,该定义已获得治理委员会的批准,并受到变更管理的控制。 如果某人提出一个方案,希望为特定字段添加值,或者以不同的方式使用该字段,则他们需要提供业务方案以及成本影响说明,并获得治理委员会的批准。
您是否曾经因数据质量定义而产生冲突?
Latulippe: 需要让数据使用者与数据创建者进行交流。 我认为这样可以帮助双方更加深刻地认识到数据是如何在需要它的业务流程中使用的。 以往,这些团队无法真正进行协作。 如果发生无法解决的实际冲突,通常意味着需要一个新的数据字段。 需要做的是,跟踪数据在企业中的移动,并提供相应财务支持。
例如,我们对缺少邮政编码所造成的影响进行了成本分析, 结果发现,并非所有应用系统都需要在其数据模型或数据输入屏幕中提供邮政编码。 该委员会跟踪整个流程,发现某个数据点一旦缺失,就会对公司产生巨大的成本影响。 因此,该数据点现在已成为全球范围的必填字段,在输入时会对此进行实时检查。
在治理委员会中,不同领域的人员会共同定义数据质量。 同一组数据可以具有不同的数据质量定义吗?
Latulippe: 让我们回到数据生命周期中寻找答案,使用者所定义的高质量数据以及营销需要的数据与某人应 CRM 需要尝试填入销售订单中的数据是不同的。 数据在其使用生命周期中的位置将决定每个属性所需的质量级别。 随着该生命周期从营销活动到数据保留的成熟度,以及所使用属性数量的增加,预期的数据质量也会提高。
是否要让企业的业务部门分担数据质量和治理责任? 请考虑根据您的角色获得相应级别的数据质量认证。
好文章,需要你的鼓励
穆拉蒂时隔18个月首次接受重大媒体采访,介绍其创立的Thinking Machines Lab正在开发的"交互模型"。该模型能以200毫秒间隔处理音频、文本和视频流,捕捉人类交流中的中断、修正和停顿。她还谈及OpenAI"政变周"经历,强调行业决策权过于集中的担忧,并回应了公司近期研究人员离职问题,表示这是初创实验室的正常波动。
伊尔德兹技术大学团队通过词典手术和离线蒸馏,以不足20美元成本打造出专为土耳其语优化的200M参数句子嵌入模型,在语义相似度任务上超越了参数量更大的原版教师模型。
本期《Quick Charge》播客涵盖多个热点话题:特斯拉疑似试图删除FSD欺诈相关证据以规避巨额赔付;卡特彼勒持续推进建筑领域电气化布局;住宅太阳能30%税收抵免即将到期。此外,嘉宾Tom Pacheco就高压系统与电池技术培训展开探讨,强调电动车技术人才培养的紧迫性。节目同时提醒有意安装太阳能的用户尽快行动,可通过EnergySage平台比较多家安装商报价。
LongLive-RAG由英伟达、USC与MIT联合提出,通过让AI检索自身生成的历史视频片段作为参考,解决长视频生成中的角色漂移和画面不一致问题。