做“世界的计算机”——这是微软对Azure的定位和愿景。这台“计算机”,不仅能连接我们的电脑、手机,还能连接智能穿戴设备、智能家居等不计其数的设备,为海量的数据提供计算和分析。
对应这个愿景,微软的路径非常清晰:一方面,微软智能云Azure能够提供覆盖全球、跨多个环境的底座支撑,正在让计算“无处不在”;另一方面,近两年来,微软还不断把自己的AI能力通过认知服务的方式加注与各类应用、平台和边缘,让智能也变得“无处不在”。
举例来说,通过在Azure上构建创造和训练大规模模型所需的功能, 人工智能公司OpenAI对GPT-3模型进行训练,实现了自然语言理解和生成的重大突破。而在日前的Ignite全球大会上,微软又进一步宣布开启Azure OpenAI Service的有限预览,直接在Azure上向用户提供对GPT-3的访问。
这是一项全新的Azure认知服务。据了解,除了微软智能云中内置的安全性、可靠性、合规性、数据隐私和其他企业级功能之外,微软还向使用Azure OpenAI Service的用户提供了全新工具,从而确保模型提供的输出结果,符合客户业务需求。与此同时,基于用户的使用反馈,还能加以优化升级,保证服务质量。
OpenAI与Azure的相互赋能
GPT-3是OpenAI开发的第三代GPT(预训练模型),基于1750亿个参数和庞大的训练数据集,GPT-3具备强大的自然语言处理(NLP)能力,因此去年一经发布就一炮而红。比如,GPT-3不仅可以基于对大量文本的学习自动生成特定问题的答案,甚至还可以帮助用户将自然语言转换为代码,减少开发的繁琐工作。
但是,在此之前,用户基本上都是通过OpenAI提供的公开API访问和使用GPT-3,无论是安全、合规还是数据隐私等方面都很难获得有效支持。所以,Azure OpenAI Service的推出,很好地解决了这个问题,双方的强强联合,使得用户在调用GPT-3模型时,其数据的安全性、合规性和可靠性都能得到有力保障。
举个例子,大型语言模型的训练数据很多都来自于互联网,数据的内容、质量参差不齐,如果不做筛选就直接输出结果,就可能影响数据结论。而基于Azure OpenAI Service,微软能够提供全新的工具对用户的请求和响应内容进行过滤和调节,从而帮助模型的每个应用中有效运行。此外,微软还将提供安全监控和分析,从而识别可能存在的数据滥用和误用情况。
事实上,这并不是微软与OpenAI的初次合作。在今年早些时候,微软已经在Power Apps中加入了GPT-3,通过对简单语言命令的“公式化”处理,即便没有代码和编程经验的人员,也能构建出一款简单应用程序。此外,微软子公司GitHub也与Open AI携手推出了一款基于GPT-3的模型工具“Copilot”,可以帮助开发人员更高效地编写代码,并避免重复性的开发工作。
更多Azure认知服务更新
可以看到,微软已经把自己的认知服务能力打入了企业应用的最底层,赋能于开发人员甚至是没有任何开发经验的业务人员。而除了Azure OpenAI Service,微软还在全球Ignite大会上更新了其它几项Azure认知服务:
比如Azure Cognitive Service for Language,不仅把以前在文本分析、QnA Maker 和语言理解中可用的功能整合到一个统一的服务中,同时还引入了新的 Language Studio,可以通过在单个地方提供不同的语言功能而不是多个服务,来改善开发人员体验。
当然,提升认知和智能水平,数据是“养料”也是基础。所以,在帮助企业实现高效数据治理方面,微软也是不遗余力的。比如,今年正式在由世纪互联运营的Microsoft Azure上正式商用的分析服务Azure Databricks,以及云原生聚合数据分析平台Azure Synapse Analytics,解决的就是数据的问题。
其中,Azure Databricks搞定的是数据规模化问题,可以实现不同来源的数据在统一的平台上迅速搭建、集群开启、数据共享,以及计算和分析;而Azure Synapse Analytics搞定的是数据聚合和分析的问题,能无限制地实现跨数据仓库和分析系统提取所有数据中的业务洞察,并将其通过Power BI及时呈现,或者用于机器学习和AI应用。
在微软看来,如今的算力资源已经相对充裕,而在这个过程中,要发挥云服务商的优势,就必须提供自服务的数据治理能力以及足够智能的AI能力。
在这两个方面,微软Ignite全球大会上也有不少技术升级,比如,Azure Arc更新了机器学习功能,允许客户可以在任何地方使用Azure Arc支持的Azure Machine Learning训练他们的机器学习模型;此外,用于统一数据管理的Azure Purview也有更新,能够帮助企业全面了解其数据,满足日益增长的全面数据管理服务的需求。
总而言之,无论是云、AI、还是数据,微软的最大优势都在于能够提供一站式的服务,所有的点状功能最终都归回Azure,提供统一的支持和服务体验。这便是这台“世界的计算机”的魅力所在。
>>> 2022年1月6-7日,锁定Microsoft Ignite China(微软在线技术大会中国站)
了解微软智能云的更多技术更新和客户故事
好文章,需要你的鼓励
zip2zip是一项创新技术,通过引入动态自适应词汇表,让大语言模型在推理时能够自动组合常用词组,显著提高处理效率。由EPFL等机构研究团队开发的这一方法,基于LZW压缩算法,允许模型即时创建和使用"超级tokens",将输入和输出序列长度减少20-60%,大幅提升推理速度。实验表明,现有模型只需10个GPU小时的微调即可适配此框架,在保持基本性能的同时显著降低计算成本和响应时间,特别适用于专业领域和多语言场景。
这项研究创新性地利用大语言模型(LLM)代替人类标注者,创建了PARADEHATE数据集,用于仇恨言论的无毒化转换。研究团队首先验证LLM在无毒化任务中表现可与人类媲美,随后构建了包含8000多对仇恨/非仇恨文本的平行数据集。评估显示,在PARADEHATE上微调的模型如BART在风格准确性、内容保留和流畅性方面表现优异,证明LLM生成的数据可作为人工标注的高效替代方案,为创建更安全、更具包容性的在线环境提供了新途径。
这项研究由中国科学技术大学的研究团队提出了Pro3D-Editor,一种新型3D编辑框架,通过"渐进式视角"范式解决了现有3D编辑方法中的视角不一致问题。传统方法要么随机选择视角迭代编辑,要么同时编辑多个固定视角,都忽视了不同编辑任务对应不同的"编辑显著性视角"。Pro3D-Editor包含三个核心模块:主视角采样器自动选择最适合编辑的视角,关键视角渲染器通过创新的MoVE-LoRA技术将编辑信息传递到其他视角,全视角精修器修复并优化最终3D模型。实验证明该方法在编辑质量和准确性方面显著优于现有技术。
这项研究提出了ComposeAnything,一个无需重新训练的框架,可显著提升AI图像生成模型处理复杂空间关系的能力。该技术由INRIA、巴黎高师和CNRS的研究团队开发,通过三个创新步骤工作:首先利用大型语言模型创建包含深度信息的2.5D语义布局,然后生成粗略的场景合成图作为先验指导,最后通过物体先验强化和空间控制去噪引导扩散过程。在T2I-CompBench和NSR-1K基准测试中,该方法远超现有技术,特别是在处理复杂空间关系和多物体场景时表现卓越,为AI辅助创意设计开辟新可能。