2016年,当微软宣布以Dynamics 365的形式改造其CRM和ERP战略时,微软高管们开始讨论通用数据模型(CDM),这是这些服务的核心。微软公司的高管们将CDM描述为一个“用于存储和管理业务实体的业务数据库,而且是开箱即用的。”CDM并不性感,但绝对是非常必要的。
切到2018年。
在上个月举行的Ignite IT Pro会议上,微软围绕着新的开放数据计划(Open Data Initiative ,ODI)做了大量工作,这是微软与其他两个合作伙伴——Adobe和SAP合作推出的一个计划。在Ignite大会上介绍ODI的时候,微软的高管们几乎没有透露任何关于它的细节,除了一些暗示表明CDM是其中的关键。
但是,微软确实在Ignite大会上的一个名为“微软通用数据模型介绍(Introduction to the Microsoft Common Data Model)”的会议环节中分享了更多关于ODI的细节。(点击此处可以观看该会议的视频,本文中嵌入的大多数幻灯片均来自此次演讲。)在这个会议环节中,微软清楚地表明CDM绝对是微软数据集成领域计划的关键所在。
在这次会议中,微软的高管们指出CDM是Dynamics 365的一部分。他们随后通过GitHub开放了CDM和250多个实体的源代码。然而,CDM不只是关于实体的。它还包括有关这些实体的关系、层次结构和特征的元数据。CDM是微软的通用数据服务(本文稍后将详细介绍)、PowerApps和Power BI的一部分。未来某些Azure数据服务也将支持它。
官方表示,CDM将作为ODI的一部分发展,提供跨数据、应用程序等的架构和语义。 然而,他们没有具体说明它将以何种方式发展。
CDM并不是微软唯一的ODI。Azure Data Lake是另一个重要的基础部分。微软官方表示,该公司的目标是打破数据湖中的数据孤岛,这意味着实体、元数据系统和自我描述数据文件夹(被称为CDM文件夹)之间更高的兼容性。
在Ignite CDM会议期间,有一些强烈的暗示表明Informatica可能是下一个加入ODI的公司。并且讨论了Azure数据服务——Azure数据工厂(Azure Data Factory)、Azure Databricks、Azure机器学习(Azure Machine Learning)和Azure数据仓库(Azure Data Warehouse)——适用ODI框架。
CDM也是微软改进的CDS或通用数据服务(Common Data Service)的核心。微软最近推出的应用程序通用数据服务基本上是XRM(微软的“任何关系管理”平台,用于编写业务线应用程序)的重新访问,现在运行在Azure上。
在Ignite大会上的一个关于微软Project的会议中,微软的高管们展示了一张关于该公司正在构建的新Microsoft Project Service的有趣的幻灯片:
看看微软在其针对应用程序的通用数据服务上构建的所有应用程序/服务:路径图和项目管理(Roadmap and Project Management,均为新Project服务的一部分)、销售(Sales)、现场服务(Field Service)、客户服务(Customer Service)、时间和费用(Time & Expense)、和资源管理(Resource Management)。
将所有这些CDM、CDS for Apps和Azure服务放在一起,你就可以更全面地了解微软对Open Data Initiative等的期望:
微软为ODI制定的长期目标雄心勃勃。该平台旨在吸引所有人,从只具备很少编码技能的业务分析师到精通编程的数据科学家和工程师。但是现在,ODI是占位符。这是微软的一种表达方式,显示出自身对单一用户数据视图概念的认真态度。但是就可交付成果而言,到目前为止,似乎除了一些幻灯片之外就乏善可陈了。
微软的高管们对Ignite大会的与会者们表示,他们正在研究Dynamics 365 for Finance&Operations、Marketing、Talent等实体定义。并计划在其Azure数据服务中与CDM集成预览。并且,微软计划在未来几周和几个月内更多地讨论开放数据计划的内容。
好文章,需要你的鼓励
企业谈AI基础设施时,注意力往往首先集中在模型、GPU和算力集群上。但当大模型应用走向规模化推理,一个瓶颈开始浮现:算力采购完成,并不意味着Token能够被稳定、低成本、可控地交付出去。
STATE16研究院这篇综述发现,物理AI系统存在"静默失效"风险——AI以高度自信执行基于错误世界信息的动作,却不触发任何报警,并提出在AI输出与物理执行之间建立独立授权层的框架。
穆拉蒂时隔18个月首次接受重大媒体采访,介绍其创立的Thinking Machines Lab正在开发的"交互模型"。该模型能以200毫秒间隔处理音频、文本和视频流,捕捉人类交流中的中断、修正和停顿。她还谈及OpenAI"政变周"经历,强调行业决策权过于集中的担忧,并回应了公司近期研究人员离职问题,表示这是初创实验室的正常波动。
UIUC与微软联合研发的OpenWebRL框架让4B小模型仅凭400条初始数据,通过在真实网站上边做边学的强化学习方式,在网页智能体基准上超越了用27万条数据训练的竞争对手。