2016年,当微软宣布以Dynamics 365的形式改造其CRM和ERP战略时,微软高管们开始讨论通用数据模型(CDM),这是这些服务的核心。微软公司的高管们将CDM描述为一个“用于存储和管理业务实体的业务数据库,而且是开箱即用的。”CDM并不性感,但绝对是非常必要的。
切到2018年。
在上个月举行的Ignite IT Pro会议上,微软围绕着新的开放数据计划(Open Data Initiative ,ODI)做了大量工作,这是微软与其他两个合作伙伴——Adobe和SAP合作推出的一个计划。在Ignite大会上介绍ODI的时候,微软的高管们几乎没有透露任何关于它的细节,除了一些暗示表明CDM是其中的关键。
但是,微软确实在Ignite大会上的一个名为“微软通用数据模型介绍(Introduction to the Microsoft Common Data Model)”的会议环节中分享了更多关于ODI的细节。(点击此处可以观看该会议的视频,本文中嵌入的大多数幻灯片均来自此次演讲。)在这个会议环节中,微软清楚地表明CDM绝对是微软数据集成领域计划的关键所在。
在这次会议中,微软的高管们指出CDM是Dynamics 365的一部分。他们随后通过GitHub开放了CDM和250多个实体的源代码。然而,CDM不只是关于实体的。它还包括有关这些实体的关系、层次结构和特征的元数据。CDM是微软的通用数据服务(本文稍后将详细介绍)、PowerApps和Power BI的一部分。未来某些Azure数据服务也将支持它。
官方表示,CDM将作为ODI的一部分发展,提供跨数据、应用程序等的架构和语义。 然而,他们没有具体说明它将以何种方式发展。
CDM并不是微软唯一的ODI。Azure Data Lake是另一个重要的基础部分。微软官方表示,该公司的目标是打破数据湖中的数据孤岛,这意味着实体、元数据系统和自我描述数据文件夹(被称为CDM文件夹)之间更高的兼容性。
在Ignite CDM会议期间,有一些强烈的暗示表明Informatica可能是下一个加入ODI的公司。并且讨论了Azure数据服务——Azure数据工厂(Azure Data Factory)、Azure Databricks、Azure机器学习(Azure Machine Learning)和Azure数据仓库(Azure Data Warehouse)——适用ODI框架。
CDM也是微软改进的CDS或通用数据服务(Common Data Service)的核心。微软最近推出的应用程序通用数据服务基本上是XRM(微软的“任何关系管理”平台,用于编写业务线应用程序)的重新访问,现在运行在Azure上。
在Ignite大会上的一个关于微软Project的会议中,微软的高管们展示了一张关于该公司正在构建的新Microsoft Project Service的有趣的幻灯片:
看看微软在其针对应用程序的通用数据服务上构建的所有应用程序/服务:路径图和项目管理(Roadmap and Project Management,均为新Project服务的一部分)、销售(Sales)、现场服务(Field Service)、客户服务(Customer Service)、时间和费用(Time & Expense)、和资源管理(Resource Management)。
将所有这些CDM、CDS for Apps和Azure服务放在一起,你就可以更全面地了解微软对Open Data Initiative等的期望:
微软为ODI制定的长期目标雄心勃勃。该平台旨在吸引所有人,从只具备很少编码技能的业务分析师到精通编程的数据科学家和工程师。但是现在,ODI是占位符。这是微软的一种表达方式,显示出自身对单一用户数据视图概念的认真态度。但是就可交付成果而言,到目前为止,似乎除了一些幻灯片之外就乏善可陈了。
微软的高管们对Ignite大会的与会者们表示,他们正在研究Dynamics 365 for Finance&Operations、Marketing、Talent等实体定义。并计划在其Azure数据服务中与CDM集成预览。并且,微软计划在未来几周和几个月内更多地讨论开放数据计划的内容。
好文章,需要你的鼓励
清华大学团队突破性开发"零样本量化"技术,让AI模型在不接触真实数据的情况下完成高效压缩,性能反超传统方法1.7%,为隐私保护时代的AI部署开辟新路径。
普林斯顿大学研究团队开发出"LLM经济学家"框架,首次让AI学会为虚拟社会制定税收政策。系统包含基于真实人口数据的工人AI和规划者AI两层,通过自然语言交互找到最优经济政策,甚至能模拟民主投票。实验显示AI制定的税收方案接近理论最优解,为AI参与社会治理提供了新路径。
K Prize是由Databricks和Perplexity联合创始人推出的AI编程挑战赛,首轮比赛结果显示,获胜者巴西工程师Eduardo Rocha de Andrade仅答对7.5%的题目就获得5万美元奖金。该测试基于GitHub真实问题,采用定时提交系统防止针对性训练,与SWE-Bench 75%的最高得分形成鲜明对比。创始人承诺向首个在该测试中得分超过90%的开源模型提供100万美元奖励。
南开大学研究团队提出了一种新的3D高斯泼溅重光照方法,通过在高斯原语上直接编码离散化SDF值,避免了传统方法需要额外SDF网络的问题。该方法设计了投影一致性损失来约束离散SDF样本,并采用球形初始化避免局部最优。实验表明,新方法在保持高质量重光照效果的同时,仅需现有方法20%的显存,显著提升了训练和渲染效率。