微软Build开发者大会——Build 2021,又回来了!现在,即使是线上的活动也形成了一年一度的新传统不过,微软还保持了另一项由来已久的传统,就是利用Build开发人员大会来宣布公司在数据和分析方面的新进展。
今年,尽管微软本身并没有带来突破性的新闻,但是在云端的BI和数据库产品方面,微软交出了长长的清单,里面列举了很多新功能和新服务,这些内容也非常令人印象深刻。
全程强大的数据流和聚合
让我们从微软的Power BI公告开始。公告包含了处理从数据来源(Azure IoT Hub和Azure Event Hubs)获得数据流的Power BI数据流功能(云端的功能就是Power Query)。微软的团队承诺称,它将让流数据和实时分析像批处理数据和常规分析一样易于使用——不仅仅是针对BI专家和数据工程师,还可以适用于商业用户。而且由于事件中心(Event Hubs)可以在Apache Kafka兼容模式下工作,因此引发了一个问题,即该功能是否有一天可以与该开源流事件平台一起工作。
另一个有趣的功能被称为自动聚合。要了解此功能,你必须了解作为其基础的基本聚合功能。基本聚合功能使你可以在度量的基础上预先计算聚合,从而获得出色的性能,特别是针对那些Power BI已经通过DirectQuery连接了的数据源时,更是如此。DirectQuery可以从后端数据源获取数据。
通过聚合,Power BI可以避免一直到后端获取通用汇总数据,而将这种方式保留给相对较少的详细数据集。聚合的问题在于,用户必须在建模Power BI要查询数据的时候设计聚合。这里有一个好消息,自动聚合功能将根据实际观察到的查询模式自动构建这些算法,随着收集到的此类观察结果数量的增加,它的表现还会变得越来越好。
数据流和自动聚合的预览版本都将在7月发布,这两个功能都是Power BI Premium专有的。由于Premium现在是按用户提供服务,用户需要在Power BI Pro的基础上每个月多支付10美元以使用Premium功能。因此这些功能和更多的用户都相关。同时,另一项Premium功能——Power BI部署管道(Power BI deployment pipelines)——可以获取面向开发人员的自动化API(Automation APIs)以支持Azure DevOps、GitHub和Azure Pipelines等工具,让它们可以自动化地部署Power BI资产。自动化API(Automation APIs)现在已经可以使用了。
这里有很多只针对Premium用户的功能,而“高级用户”的定价意味着我们将会看到更多这样的功能。同时,微软还发布了一个很酷的新功能,该功能允许将Power BI报告被内嵌到Jupyter笔记本中——作为开源Python包。而且它与Power BI Pro兼容,包括可免费试用的版本。下图是一个装有Power BI的Jupyter笔记本的图片。
COSMOS DB:无服务器、缓存、加密和免费
在数据库方面,微软发布了很多关于Cosmos DB的消息,还有一些是关于MySQL和Postgres的零散消息。
首先,是Cosmos DB——微软的大规模多模型托管NoSQL数据库。微软将无服务器选项纳入了Cosmos DB的通用可选范围之内,并包含Cosmos的很多API,将它的云原生谱系拓展了一步。无服务器版本的Cosmos DB让用户可以在无需提供显式规模集群的情况下使用它,因此能够更好地应对微软所谓的“尖峰流量模式”。即使对于习惯了集群规模调整的客户来说,这种无服务器的选项也将在实质上提供零维护的自动规模调整。毕竟,无服务器的信条是让服务承担在你需要的时候为你分配资源的责任。
Cosmos也获得了很多新功能,那些熟悉旧式关系型数据库的专业人员们可能会喜欢这些功能。其中包括集成的缓存,基于角色的访问控制(RBAC)和始终加密(Always Encrypted)——这是一个源自SQL Server和Azure SQL数据库的功能,在数据被存入数据库之前,就在应用程序内进行完全加密。集成的缓存服务特别有趣,因为它不仅可以提高性能,而且可以通过减少对数据库的完整读取来节省资金。微软表示,缓存可以降低成本,并将大量读取工作负载的性能分别提高多达96%和300%。
Cosmos DB还扩展了它的免费功能。新产品为开发人员提供每个月1,000 RU/s(每秒请求单位)的预配置吞吐量和25GB的免费存储空间。谈到免费——微软已经在这个方向努力了一段时间了,该公司提供了Cosmos DB仿真器,它让开发人员能够在正常工作的Cosmos DB实例上运行其代码,而且无需支付任何云费用。以前,该仿真器只能在Windows计算机上运行,但是微软今天发布了该仿真器的Linux版本,它也可以运行在Mac机器上。像Cosmos DB Serverless一样,新发布的免费功能都已经全面上市。同时,集成缓存、始终加密(Always Encrypted)和Linux仿真器推出了预览版。
回到关系数据库的世界,微软宣布将从六月开始提供12个月免费的Azure Database for PostgreSQL和Azure Database for MySQL Flexible Server,微软将为使用Azure免费帐户的用户每个月提供最多750个小时的免费服务。此外,对于Azure Database for PostgreSQL——Hyperscale (Citus)这个新推出的免费功能预览版,微软将提供基于单节点部署的入门级功能。至少可以说,对于单节点部署来说,无论如何都很难说得上有“超大规模”,所以最好用和Cosmos DB仿真器相同的方式来对待它——作为开发和测试代码的一个工作端点。区别在于它可以就地生产,因为微软提供了后续增加工作节点并进行扩展的选项。
好文章,需要你的鼓励
Docker公司通过增强的compose框架和新基础设施工具,将自己定位为AI智能体开发的核心编排平台。该平台在compose规范中新增"models"元素,允许开发者在同一YAML文件中定义AI智能体、大语言模型和工具。支持LangGraph、CrewAI等多个AI框架,提供Docker Offload服务访问NVIDIA L4 GPU,并与谷歌云、微软Azure建立合作。通过MCP网关提供企业级安全隔离,解决了企业AI项目从概念验证到生产部署的断层问题。
中科院联合字节跳动开发全新AI评测基准TreeBench,揭示当前最先进模型在复杂视觉推理上的重大缺陷。即使OpenAI o3也仅获得54.87%分数。研究团队同时提出TreeVGR训练方法,通过要求AI同时给出答案和精确定位,实现真正可追溯的视觉推理,为构建更透明可信的AI系统开辟新路径。
马斯克的AI女友"Ani"引爆全球,腾讯RLVER框架突破情感理解边界:AI下半场竞争核心已转向对人性的精准把握。当技术学会共情,虚拟陪伴不再停留于脚本应答,而是通过"心与心的循环"真正理解人类孤独——这背后是强化学习算法与思考模式的化学反应,让AI从解决问题转向拥抱情感。
PyVision是上海AI实验室开发的革命性视觉推理框架,让AI系统能够根据具体问题动态创造Python工具,而非依赖预设工具集。通过多轮交互机制,PyVision在多项基准测试中实现显著性能提升,其中在符号视觉任务上提升达31.1%。该框架展现了从"工具使用者"到"工具创造者"的AI能力跃迁,为通用人工智能的发展开辟了新路径。