微软Build开发者大会——Build 2021,又回来了!现在,即使是线上的活动也形成了一年一度的新传统不过,微软还保持了另一项由来已久的传统,就是利用Build开发人员大会来宣布公司在数据和分析方面的新进展。
今年,尽管微软本身并没有带来突破性的新闻,但是在云端的BI和数据库产品方面,微软交出了长长的清单,里面列举了很多新功能和新服务,这些内容也非常令人印象深刻。
全程强大的数据流和聚合
让我们从微软的Power BI公告开始。公告包含了处理从数据来源(Azure IoT Hub和Azure Event Hubs)获得数据流的Power BI数据流功能(云端的功能就是Power Query)。微软的团队承诺称,它将让流数据和实时分析像批处理数据和常规分析一样易于使用——不仅仅是针对BI专家和数据工程师,还可以适用于商业用户。而且由于事件中心(Event Hubs)可以在Apache Kafka兼容模式下工作,因此引发了一个问题,即该功能是否有一天可以与该开源流事件平台一起工作。
另一个有趣的功能被称为自动聚合。要了解此功能,你必须了解作为其基础的基本聚合功能。基本聚合功能使你可以在度量的基础上预先计算聚合,从而获得出色的性能,特别是针对那些Power BI已经通过DirectQuery连接了的数据源时,更是如此。DirectQuery可以从后端数据源获取数据。
通过聚合,Power BI可以避免一直到后端获取通用汇总数据,而将这种方式保留给相对较少的详细数据集。聚合的问题在于,用户必须在建模Power BI要查询数据的时候设计聚合。这里有一个好消息,自动聚合功能将根据实际观察到的查询模式自动构建这些算法,随着收集到的此类观察结果数量的增加,它的表现还会变得越来越好。
数据流和自动聚合的预览版本都将在7月发布,这两个功能都是Power BI Premium专有的。由于Premium现在是按用户提供服务,用户需要在Power BI Pro的基础上每个月多支付10美元以使用Premium功能。因此这些功能和更多的用户都相关。同时,另一项Premium功能——Power BI部署管道(Power BI deployment pipelines)——可以获取面向开发人员的自动化API(Automation APIs)以支持Azure DevOps、GitHub和Azure Pipelines等工具,让它们可以自动化地部署Power BI资产。自动化API(Automation APIs)现在已经可以使用了。
这里有很多只针对Premium用户的功能,而“高级用户”的定价意味着我们将会看到更多这样的功能。同时,微软还发布了一个很酷的新功能,该功能允许将Power BI报告被内嵌到Jupyter笔记本中——作为开源Python包。而且它与Power BI Pro兼容,包括可免费试用的版本。下图是一个装有Power BI的Jupyter笔记本的图片。
COSMOS DB:无服务器、缓存、加密和免费
在数据库方面,微软发布了很多关于Cosmos DB的消息,还有一些是关于MySQL和Postgres的零散消息。
首先,是Cosmos DB——微软的大规模多模型托管NoSQL数据库。微软将无服务器选项纳入了Cosmos DB的通用可选范围之内,并包含Cosmos的很多API,将它的云原生谱系拓展了一步。无服务器版本的Cosmos DB让用户可以在无需提供显式规模集群的情况下使用它,因此能够更好地应对微软所谓的“尖峰流量模式”。即使对于习惯了集群规模调整的客户来说,这种无服务器的选项也将在实质上提供零维护的自动规模调整。毕竟,无服务器的信条是让服务承担在你需要的时候为你分配资源的责任。
Cosmos也获得了很多新功能,那些熟悉旧式关系型数据库的专业人员们可能会喜欢这些功能。其中包括集成的缓存,基于角色的访问控制(RBAC)和始终加密(Always Encrypted)——这是一个源自SQL Server和Azure SQL数据库的功能,在数据被存入数据库之前,就在应用程序内进行完全加密。集成的缓存服务特别有趣,因为它不仅可以提高性能,而且可以通过减少对数据库的完整读取来节省资金。微软表示,缓存可以降低成本,并将大量读取工作负载的性能分别提高多达96%和300%。
Cosmos DB还扩展了它的免费功能。新产品为开发人员提供每个月1,000 RU/s(每秒请求单位)的预配置吞吐量和25GB的免费存储空间。谈到免费——微软已经在这个方向努力了一段时间了,该公司提供了Cosmos DB仿真器,它让开发人员能够在正常工作的Cosmos DB实例上运行其代码,而且无需支付任何云费用。以前,该仿真器只能在Windows计算机上运行,但是微软今天发布了该仿真器的Linux版本,它也可以运行在Mac机器上。像Cosmos DB Serverless一样,新发布的免费功能都已经全面上市。同时,集成缓存、始终加密(Always Encrypted)和Linux仿真器推出了预览版。
回到关系数据库的世界,微软宣布将从六月开始提供12个月免费的Azure Database for PostgreSQL和Azure Database for MySQL Flexible Server,微软将为使用Azure免费帐户的用户每个月提供最多750个小时的免费服务。此外,对于Azure Database for PostgreSQL——Hyperscale (Citus)这个新推出的免费功能预览版,微软将提供基于单节点部署的入门级功能。至少可以说,对于单节点部署来说,无论如何都很难说得上有“超大规模”,所以最好用和Cosmos DB仿真器相同的方式来对待它——作为开发和测试代码的一个工作端点。区别在于它可以就地生产,因为微软提供了后续增加工作节点并进行扩展的选项。
好文章,需要你的鼓励
施耐德电气以“新质服务+产业向‘新’行”为主题,第六次参会,展示全新升级的“新质服务体系”,围绕创新驱动、生态协同和行业赋能三大核心领域,以全新升级的“新质服务体系”,助力中国产业向高端化、智能化、绿色化迈进。
香港中文大学联合上海AI实验室推出Dispider系统,首次实现AI视频"边看边聊"能力。通过创新的三分式架构设计,将感知、决策、反应功能独立分离,让AI能像人类一样在观看视频过程中进行实时交流,在StreamingBench测试中显著超越现有系统,为教育、娱乐、医疗、安防等领域的视频AI应用开启新可能。
甲骨文正在成为大规模基础设施供应商的可靠选择。该公司通过AI技术推动应用开发,构建GenAI模型并将智能代理集成到应用套件中。CEO萨弗拉·卡茨透露,公司剩余履约义务达4553亿美元,同比增长4.6倍,并预测OCI收入将从2026财年的180亿美元增长至2030财年的1440亿美元。甲骨文正积极布局AI推理市场,凭借其作为全球最大企业私有数据托管方的优势地位,有望在云计算领域实现重大突破。
Atla公司发布Selene Mini,这是一个仅有80亿参数的AI评估模型,却在11个基准测试中全面超越GPT-4o-mini。通过精心的数据筛选和创新训练策略,该模型不仅能准确评判文本质量,还能在医疗、金融等专业领域表现出色。研究团队将模型完全开源,为AI评估技术的普及和发展做出贡献。