微软近日在Build 大会上发布了约 60 项公告,其中包括云数据库管理产品新的人工智能功能。
该公司去年推出的统一数据平台Fabric是一个主要受益者。一个目前处于预览阶段的工作负载开发工具包(Workload Development Kit)可用于扩展 Fabric中的应用。Fabric Data Sharing是一项新功能,可跨用户和应用程序处理实时数据。它包括一个应用程序接口,用于访问存储在外部源中的数据。新的自动化功能(Automation)可简化重复性任务。
全新的RESTful GraphQL API可让Fabric开发人员通过单个查询访问来自多个来源的数据。扩展的用户数据功能可以使用本地代码能力和自定义逻辑,通过简单的集成在Fabric湖库、数据仓库和镜像数据库中构建以数据为中心的应用程序。
微软表示,Fabric在人工智能方面增加了生成式人工智能功能,使非技术用户也能构建能用自然语言回答问题的应用程序。该公司还在每一层添加了Azure OpenAI Services,以创建数据流和管道、生成代码并构建机器学习模型。
Fabric中的一个新的实时智能功能是一个软件即服务应用程序,它创建了一个从不同来源摄取、处理和路由事件的单一场所。事件流可以使用预配置的流连接器进行处理,并通过基于内容的路由连接到云源。
私人预览版中的Fabric Copilot可用于生成查询,以检测大规模数据中超出人类分析范畴的未知情况。
面向 PostgreSQL、CosmosDB 开发人员的人工智能
针对PostgreSQL的微软Azure数据库也通过Azure OpenAI Service或数据库内模型获得了人工智能功能,供那些希望将数据保存在数据库实例中的人使用。
Azure AI扩展让开发人员可以在他们的PostgreSQL 应用程序中利用 Azure AI 的大型语言模型。他们可以调用Azure OpenAI Service生成基于 LLM 的向量嵌入,从而实现高效的相似性搜索,还可以调用Azure AI Language处理情感分析、语言检测和实体识别等场景。
开发人员还可以针对欺诈检测和产品推荐等场景调用预先训练过的机器学习模型。可使用 Azure AI Translator 进行实时文本翻译。
数据库内嵌入生成功能支持Azure Database for PostgreSQL中的文本嵌入模型,无需调用 Azure OpenAI Service即可在数据库内生成嵌入。微软表示,这将嵌入创建时间缩短为几个毫秒的延迟,成本更可预测。
用于构建大型应用程序的全球分布式多模型数据库服务CosmosDB正在进行几项与人工智能相关的更新。Cosmos DB for NoSQL现已内置矢量索引和矢量相似性搜索,使数据和矢量保持同步,而无需单独的数据库。该功能由DiskANN(一套近似近邻搜索算法的开源软件)提供,目前处于预览阶段。
现在预览版中的一项新功能可让用户通过Azure门户或命令行界面将其无服务器 Azure Cosmos DB 账户过渡到配置容量模式,同时保留对数据操作的完全访问权限。
预览版中的一个新选项可让Cosmos DB for MongoDB用户在另一个区域创建一个持续更新的集群副本,以便进行故障转移。新的Go软件开发工具包可跨多个区域对数据库、容器和项目进行操作,实现高可用性应用。
好文章,需要你的鼓励
穆拉蒂时隔18个月首次接受重大媒体采访,介绍其创立的Thinking Machines Lab正在开发的"交互模型"。该模型能以200毫秒间隔处理音频、文本和视频流,捕捉人类交流中的中断、修正和停顿。她还谈及OpenAI"政变周"经历,强调行业决策权过于集中的担忧,并回应了公司近期研究人员离职问题,表示这是初创实验室的正常波动。
STATE16研究院这篇综述发现,物理AI系统存在"静默失效"风险——AI以高度自信执行基于错误世界信息的动作,却不触发任何报警,并提出在AI输出与物理执行之间建立独立授权层的框架。
本期《Quick Charge》播客涵盖多个热点话题:特斯拉疑似试图删除FSD欺诈相关证据以规避巨额赔付;卡特彼勒持续推进建筑领域电气化布局;住宅太阳能30%税收抵免即将到期。此外,嘉宾Tom Pacheco就高压系统与电池技术培训展开探讨,强调电动车技术人才培养的紧迫性。节目同时提醒有意安装太阳能的用户尽快行动,可通过EnergySage平台比较多家安装商报价。
UIUC与微软联合研发的OpenWebRL框架让4B小模型仅凭400条初始数据,通过在真实网站上边做边学的强化学习方式,在网页智能体基准上超越了用27万条数据训练的竞争对手。