至顶网软件频道消息: 微软今天在Build开发者大会上公布了一系列新的云服务,旨在让企业组织能够更有效地运用人工智能。
最大的亮点是一个名为“Brainwave Project”的实验性项目。它提供了在微软云数据中心对专有芯片的访问权限,这些芯片专门设计运行深度学习模型,因此性能上远超过普通芯片。
芯片方面是来自英特尔Startix系列的FPGA。FPGA可以定制,一直定制到电路,并通过优化来加快运行特定任务的速度。在Brainwave项目中,微软为其处理器配备了自行开发的人工智能引擎,以及旨在简化模型部署的组件。
因此,这项服务让开发者可以利用这些芯片,而无需通常所需的高度专业化软件工具。这些服务可以利用流行的TensorFlow AI开发框架,或者微软与之竞争的Cognitive Toolkit,这两者都是开源的。
微软计划随着时间的推移将增加对更深层次学习引擎的支持,并将Brainwave带入Azure Stack系统,这些系统都是由合作伙伴出售的设备,让企业能够在他们自己的数据中心内创建一个基本上是微软云平台的副本。
增加对Azure Stack的支持,这是微软将其AI服务扩展到公共云之外的一部分举措。该计划的另一个关键要素是Azure IoT Edge平台,这是一套分析工具,可以部署在工业系统等联网设备上,以分析本地重要数据。微软今天宣布,该产品将提供对Cognitive Services产品线的访问,从Custom Vision产品开始。
顾名思义,Custom Vision可以让开发人员创建定制的人工智能模型,以处理特定类型的视觉内容。微软今天上午公布了这项服务的升级迭代,可用于识别图像中的单个对象。
除此之外,微软其他计算机视觉服务也进行了一系列更新,以及一项名为“Project Ink Analysis”的全新实验性产品。微软表示,这款工具可以自动从手写文档中提取文本和形状。对于那些希望减少处理物理记录所需人数的企业组织来说,这是很便利的。
除了这些更新之外,微软还增强了部分专注于语音处理的人工智能产品组合。微软已经将之前完全不同的语音识别、转录、文本到语音和翻译服务整合到一个旨在简化开发人员工作的单一API中。
好文章,需要你的鼓励
腾讯今日开源混元MT系列语言模型,专门针对翻译任务进行优化。该系列包含四个模型,其中两个旗舰模型均拥有70亿参数。腾讯使用四个不同数据集进行初始训练,并采用强化学习进行优化。在WMT25基准测试中,混元MT在31个语言对中的30个表现优于谷歌翻译,某些情况下得分高出65%,同时也超越了GPT-4.1和Claude 4 Sonnet等模型。
腾讯ARC实验室推出AudioStory系统,首次实现AI根据复杂指令创作完整长篇音频故事。该系统结合大语言模型的叙事推理能力与音频生成技术,通过交错式推理生成、解耦桥接机制和渐进式训练,能够将复杂指令分解为连续音频场景并保持整体连贯性。在AudioStory-10K基准测试中表现优异,为AI音频创作开辟新方向。
今年是Frontiers Health十周年。在pharmaphorum播客的Frontiers Health限定系列中,网络编辑Nicole Raleigh采访了Startup Health总裁兼联合创始人Unity Stoakes。Stoakes在科技、科学和设计交汇领域深耕30多年,致力于变革全球健康。他认为,Frontiers Health通过精心选择的空间促进有意义的网络建设,利用网络效应推进创新力量,让企业家共同构建并带来改变,从而有益地影响全球人类福祉。
Meta与特拉维夫大学联合研发的VideoJAM技术,通过让AI同时学习外观和运动信息,显著解决了当前视频生成模型中动作不连贯、违反物理定律的核心问题。该技术仅需添加两个线性层就能大幅提升运动质量,在多项测试中超越包括Sora在内的商业模型,为AI视频生成的实用化应用奠定了重要基础。