今天,在拉斯维加斯举行的Inspire合作伙伴会议上,微软发布了更多与数据相关的公告,包括该公司自己在Azure上的数据仓库服务以及Power BI服务。
在数据仓库方面,微软为其Azure SQL Data Warehouse(SQL DW)服务宣布了一项名为Instant Data Movement的新功能。通过在一个大的逻辑服务器中将多个服务器(节点)联合在一起,数据仓库平台获得了更高的速度。当在这个逻辑服务器上运行查询时,数据通常要在节点之间进行移动,数据仓库执行此操作的速度对于其性能来说至关重要,SQL DW只是让这样的操作变得更快。
该产品使用了一种被称为数据移动服务(Data Movement Service ,DMS)的功能来处理这项任务,它一直表现良好,因为它基于一种长期以来一直很高效的SQL Server技术,这种技术被称为批量复制协议(Bulk Copy Protocol,BCP)。但是,BCP的问题在于它采用了单线执行模式,在单个处理器内核上使用SQL Server的单线程操作模式。
但是,SQL Server Gen2存储的用户现在可以利用即时数据移动(Instant Data Movement ,IDM),它可以在多个CPU内核上执行,并使用SQL Server新的批处理模式(基于矢量处理)。结果是数据能够更快地移动,因此当查询没有进行物理排列的连接表时,查询性能更高。事实上,微软表示,结合其新的Azure Accelerated Networking,SQL DW可以以每个节点每秒高达1GB的速度移动数据。
在IDM和由于SQL DW Gen2存储和缓存带来的性能提升之间,微软对于该产品的性能非常有信心。事实上,这种信心是如此之强大,以至于该公司委托了分析公司GigaOm Research在SQL DW上进行同Amazon Redshift比对的TPC-H基准测试,而且看起来似乎结果非常乐观。
信息披露:我自己为GigaOm Research做分析师的工作。我没有参与SQL DW TPC-H基准测试项目,不过我知道它正在进行。
微软对TPC-H基准测试工作的讨论将在博客文章中进行介绍,GigaOm的报告也可以点击这里在线获取。
增强了的Power BI
在Power BI方面,微软已在云Big Data和Enterprise上都加强了流行的商业智能(Business Intelligence)服务。
对于前者,微软强化了Power Query自助服务数据准备工具(也嵌入在Windows版本的Excel中),以处理存储在Power BI云服务中的数据,而不是将其功能限制在存储在桌面电脑中的Power BI模型中。
根据Power Query云功能的实现方式,它可以为微软的Azure数据工厂(Azure Data Factory)服务提供一个非常有趣的伴奏,其主要改进是6月27日公告的一部分。此外,Power BI正在与Azure Data Lake Storage Gen2(也于6月27日发布并且目前处于预览阶段)集成,对Azure Blob Storage的改进消除了文件大小限制,并且增加了一个访问接口,使其与Hadoop Distributed File System (HDFS)——这种经典的大数据存储技术兼容。
Power BI基于微软长期的SQL Server Analysis Services(SSAS)技术,而从现在开始,Power BI集成了许多SSAS功能。包括与XML for Analysis(XMLA)的兼容性,这是SSAS的本地协议。XMLA兼容性带来了与为SSAS协同工作而构建的一系列工具的兼容性,使Power BI能够更好地针对企业。
Power BI还与微软的企业报告技术——SQL Server Reporting Services(SSRS)进行了集成。现在,除了Power BI报告和面板之外,Power BI云服务还将能够托管和呈现SSRS报告。
这为与本身就是SSRS内部部署的报表服务器扩展集的Power BI Report Server提供了良好的对称性,它允许本地提供的Power BI报告以及SSRS资产。现在,微软的客户将能够在本地和云端两种环境中都能够合并SSRS和Power BI报告。
为了提升Enterprise的实力,Power BI现在将提供对微软通用数据模型(Microsoft Common Data Model,CDM))的支持,并且正在增加多个地区的合规性,允许客户将Power BI Premium(非Professional)部署到全球特定的区域。 这有助于遵守数据驻留要求,增强数据局部性,从而减少数据的加载时间。
微软知道技术几乎总是通过数据和分析来实现,而且该公司正在这个领域的多款产品上加倍下注,特别是在云端更是如此。微软现在面临的问题是让市场相信该公司可以在数据领域打败亚马逊网络服务(Amazon Web Services)。虽然该公司现在正在前进,但是要想在数据领域赢得市场的民心,微软还有很多工作要做。
好文章,需要你的鼓励
微软将在今年夏季晚些时候推出Windows恢复力计划,著名的Windows蓝屏死机将被新的黑屏替代。这一变化是微软对2024年7月CrowdStrike故障事件的回应,该事件导致约850万台Windows设备瘫痪。作为Windows恢复力计划的一部分,微软正在重新设计Windows代码,让安全软件在内核外运行,以提高系统稳定性和恢复能力,减少因第三方安全软件问题导致的系统崩溃。
香港理工大学研究团队开发了突破性医学AI系统GEMeX-ThinkVG,让人工智能在分析胸片时能像医生一样详细解释诊断过程。该系统不仅能准确回答医学问题,还能标注具体的影像区域并提供完整的推理链条,解决了传统医学AI"黑盒子"问题。通过创新的强化学习训练方法,仅用八分之一数据就达到了传统方法的性能水平,为可解释医学AI开辟了新方向。
随着GPU成为AI工作负载训练和运营的关键,越来越多的云服务提供商开始提供云GPU实例。这为希望避免部署GPU硬件费用和复杂性的组织带来好消息。云GPU实例可按超大规模与专业化提供商、通用与专用实例、共享与独占服务器进行分类。选择时需考虑工作负载类型、GPU类型、成本、延迟和控制级别等因素。
希腊雅典理工大学团队开发CultureMERT-95M多文化音乐AI模型,通过两阶段持续预训练和任务算术方法,让AI系统学会理解希腊、土耳其、印度等非西方音乐传统。该模型在非西方音乐分类任务上提升4.9%准确率,同时保持西方音乐理解能力,为构建更包容的全球音乐AI系统奠定基础。