微软近日在Build 大会上发布了约 60 项公告,其中包括云数据库管理产品新的人工智能功能。
该公司去年推出的统一数据平台Fabric是一个主要受益者。一个目前处于预览阶段的工作负载开发工具包(Workload Development Kit)可用于扩展 Fabric中的应用。Fabric Data Sharing是一项新功能,可跨用户和应用程序处理实时数据。它包括一个应用程序接口,用于访问存储在外部源中的数据。新的自动化功能(Automation)可简化重复性任务。
全新的RESTful GraphQL API可让Fabric开发人员通过单个查询访问来自多个来源的数据。扩展的用户数据功能可以使用本地代码能力和自定义逻辑,通过简单的集成在Fabric湖库、数据仓库和镜像数据库中构建以数据为中心的应用程序。
微软表示,Fabric在人工智能方面增加了生成式人工智能功能,使非技术用户也能构建能用自然语言回答问题的应用程序。该公司还在每一层添加了Azure OpenAI Services,以创建数据流和管道、生成代码并构建机器学习模型。
Fabric中的一个新的实时智能功能是一个软件即服务应用程序,它创建了一个从不同来源摄取、处理和路由事件的单一场所。事件流可以使用预配置的流连接器进行处理,并通过基于内容的路由连接到云源。
私人预览版中的Fabric Copilot可用于生成查询,以检测大规模数据中超出人类分析范畴的未知情况。
面向 PostgreSQL、CosmosDB 开发人员的人工智能
针对PostgreSQL的微软Azure数据库也通过Azure OpenAI Service或数据库内模型获得了人工智能功能,供那些希望将数据保存在数据库实例中的人使用。
Azure AI扩展让开发人员可以在他们的PostgreSQL 应用程序中利用 Azure AI 的大型语言模型。他们可以调用Azure OpenAI Service生成基于 LLM 的向量嵌入,从而实现高效的相似性搜索,还可以调用Azure AI Language处理情感分析、语言检测和实体识别等场景。
开发人员还可以针对欺诈检测和产品推荐等场景调用预先训练过的机器学习模型。可使用 Azure AI Translator 进行实时文本翻译。
数据库内嵌入生成功能支持Azure Database for PostgreSQL中的文本嵌入模型,无需调用 Azure OpenAI Service即可在数据库内生成嵌入。微软表示,这将嵌入创建时间缩短为几个毫秒的延迟,成本更可预测。
用于构建大型应用程序的全球分布式多模型数据库服务CosmosDB正在进行几项与人工智能相关的更新。Cosmos DB for NoSQL现已内置矢量索引和矢量相似性搜索,使数据和矢量保持同步,而无需单独的数据库。该功能由DiskANN(一套近似近邻搜索算法的开源软件)提供,目前处于预览阶段。
现在预览版中的一项新功能可让用户通过Azure门户或命令行界面将其无服务器 Azure Cosmos DB 账户过渡到配置容量模式,同时保留对数据操作的完全访问权限。
预览版中的一个新选项可让Cosmos DB for MongoDB用户在另一个区域创建一个持续更新的集群副本,以便进行故障转移。新的Go软件开发工具包可跨多个区域对数据库、容器和项目进行操作,实现高可用性应用。
好文章,需要你的鼓励
在迪拜Gitex 2025大会上,阿联酋成为全球AI领导者的雄心备受关注。微软正帮助该地区组织从AI实验阶段转向实际应用,通过三重方法提供AI助手、协同AI代理和AI战略顾问。微软已在阿联酋大举投资数据中心,去年培训了10万名政府员工,计划到2027年培训100万学习者。阿联酋任命了全球首位AI部长,各部门都配备了首席AI官。微软与政府机构和企业合作,在公民服务和金融流程等领域实现AI的实际应用,构建全面的AI生态系统。
查尔斯大学和意大利布鲁诺·凯斯勒基金会的研究团队首次系统性解决了同声传译AI系统延迟评估的准确性问题。他们发现现有评估方法存在严重偏差,常给出相互矛盾的结果,并提出了YAAL新指标和SOFTSEGMENTER对齐工具。YAAL准确性达96%,比传统方法提升20多个百分点。研究还开发了专门的长音频评估工具LongYAAL,为AI翻译技术发展提供了可靠的测量标准。
苹果与俄亥俄州立大学研究人员发布名为FS-DFM的新模型,采用少步离散流匹配技术,仅需8轮快速优化即可生成完整长文本,效果媲美需要上千步骤的扩散模型。该模型通过三步训练法:处理不同优化预算、使用教师模型指导、调整迭代机制来实现突破。测试显示,参数量仅1.7亿至17亿的FS-DFM变体在困惑度和熵值指标上均优于70-80亿参数的大型扩散模型。
印度理工学院团队构建了史上最大规模印度文化AI测试基准DRISHTIKON,包含64288道多语言多模态题目,覆盖15种语言和36个地区。研究评估了13个主流AI模型的文化理解能力,发现即使最先进的AI也存在显著文化盲区,特别是在低资源语言和复杂推理任务上表现不佳,为构建文化感知AI提供了重要指导。