微软于今天在线举行的Build 2022大会上,公布了与人工智能研究机构OpenAI双方扩大合作的消息,宣布推出一项针对Azure Cognitive Services的新服务。该服务让开发者可以使用一系列OpenAI的AI模型,包括GPT-3基础系列、Codex系列和嵌入模型。
据微软称,OpenAI Service致力于帮助开发者部署更高质量的模型作为API,更有效地将语言功能注入应用中。微软认为,Azure OpenAI Service将帮助开发者将新的推理和理解能力引入“尖端”的应用中,特别是,微软提到了编写辅助、代码生成、理解非结构化数据等用途。
OpenAI Service是此次Build大会上推出的Azure Cognitive Services亮相重要升级之一。另一个是Azure Cognitive Service for Language,该服务提供的摘要(如下图所示),可以帮助开发者在文档和通话记录中定位关键信息,这样呼叫中心的操作员就可以获取记录并快速识别客户拨打电话的原因以及解决方案。
微软还展示了很多Azure AI的其他更新,其中最引人关注的是发布Azure Machine Learning AI 仪表板的预览版,这是Azure Machine Learning中的一项新功能,让用户可以更轻松地实施没有偏见的“负责任的AI”。包括数据浏览器、公平性、模型互操作性、错误分析、反事实和因果推理分析等工具。微软表示,这是为了帮助开发者调试他们创建的模型,并做出更明智的决策。
Azure Machine Learning是一种用于加速和管理机器学习项目的云服务,此次更新增加了多项新的功能,其中包括用于部署实时和批量推理的大型模型托管端点(现已面市),以及预览版中的AutoML功能,可为自然语言处理和图像任务提供支持、生成模型的训练代码、增强的产品集成。
和AI相关的产品更新方面,Azure Applied Services是一项旨在帮助开发者将AI应用到关键业务场景中的高级服务。此次更新中,微软向Azure Applied Services中增加了一些新的功能,针对关键任务进行了优化,包括监控和诊断度量异常、从文档中挖掘知识、通过转录分析增强客户体验、文档理解等等。
微软表示,Azure Applied Services中包括了Azure Form Recognizer,获得了新的文档处理功能,例如能够简化患者登记、使用保险和疫苗卡预建模型进行疫苗验证。同时,Power Virtual Agents新增了来自Azure Bot Service Composer的新功能,可以帮助草根开发者围绕AI机器人展开协作,这些机器人可以对手动的工作流程实施自动化。
好文章,需要你的鼓励
腾讯ARC实验室推出AudioStory系统,首次实现AI根据复杂指令创作完整长篇音频故事。该系统结合大语言模型的叙事推理能力与音频生成技术,通过交错式推理生成、解耦桥接机制和渐进式训练,能够将复杂指令分解为连续音频场景并保持整体连贯性。在AudioStory-10K基准测试中表现优异,为AI音频创作开辟新方向。
Coursera在2025年连接大会上宣布多项AI功能更新。10月将推出角色扮演功能,通过AI人物帮助学生练习面试技巧并获得实时反馈。新增AI评分系统可即时批改代码、论文和视频作业。同时引入完整性检查和监考系统,通过锁定浏览器和真实性验证打击作弊行为,据称可减少95%的不当行为。此外,AI课程构建器将扩展至所有合作伙伴,帮助教育者快速设计课程。
Meta与特拉维夫大学联合研发的VideoJAM技术,通过让AI同时学习外观和运动信息,显著解决了当前视频生成模型中动作不连贯、违反物理定律的核心问题。该技术仅需添加两个线性层就能大幅提升运动质量,在多项测试中超越包括Sora在内的商业模型,为AI视频生成的实用化应用奠定了重要基础。