微软近日宣布开放Infer.NET源代码,是微软内部开发的一个机器学习引擎,用于为Azure、Office 365和Xbox视频游戏平台提供支持。
微软已经根据MIT许可(允许免费商业使用)在GitHub上的工具提供Infer.NET代码。这是微软在位于英国剑桥的研究实验室开发Infer.NET软件第一个迭代之后的近15年来,首次开源Infer.NET。
Yordan Zaykov是Infer.NET背后的团队工程负责人,他在一篇博文中详细介绍了该引擎的演变。他写道,一开始Infer.NET软件是作为一种研究工具的,被用于创建了数百篇从流行病学到森林保护等领域的学术论文。多年来,Infer.NET发展成为Zaykov编写的可扩展引擎,到现在已经可以帮助处理微软不同服务中的PB级数据。
Infer.NET引擎与许多其他开源机器学习工具不同,它旨在促进“基于模型”的方法来构建人工智能软件,从而逆转正常的开发工作流程。
使用传统的机器学习工具时,工程师通常会利用现有的一个AI算法,根据项目的要求对其进行改进。相反,Infer.NET以这些要求为出发点,让工程师能够将项目特定信息表达为模型,并使用该模型生成针对手头任务优化的、新的自定义AI算法。
这种方法使Infer.NET非常适合依赖于大量特定领域知识的项目。此外,使用该工具创建AI算法,这是直接由它们所基于的模型决定的,为其内部工作提供了急需的可见性。
微软的Zaykov在帖子中解释说:“如果你自己已经设计了模型以及遵循这个模型的学习算法,那么你就可以理解为什么系统以特定方式运行或做出某些预测。随着机器学习应用逐渐进入我们的生活,理解和解释他们的行为变得越来越重要。”
他补充说,使用Infer.NET创建的模型可以处理各种不同的数据类型,包括需要实时处理的信息,以及不完整或有缺陷的记录。
微软计划将该引擎作为自己为广泛使用的.NET开发平台创建的ML.NET框架的一部分,后者也可以在开源许可下使用。微软还提供另一个名为Microsoft Bot Framework的开源人工智能工具,旨在构建虚拟助理。
好文章,需要你的鼓励
牛津大学提出PHYSIFORMER,一种扩散变换器模型,通过三维网格顶点轨迹直接在世界坐标空间预测刚性与弹性物体的物理运动,一次性生成全序列轨迹,超越自回归基线。
随着医疗数据数字化与互操作性的进步,跨机构纵向患者数据的研究应用成为可能。本研究通过对20位领域专家的访谈,识别出8种数据收集方法,涵盖智能手机应用、结构化数据导出、区域/全国研究查询及聚合数据源等。研究发现,各方法均有其优缺点,无单一最优方案。参与者中介交换方式可绕过复杂治理安排,但存在数据缺口;全国性网络尚不支持研究查询。公共政策的持续推进将对该领域发展起关键作用。
研究发现主流奖励模型对同等质量答案给出差异悬殊的分数,并提出"奖励聚类"算法通过蒙特卡洛随机失活将连续分数离散化,在不重训模型的前提下有效减少AI训练中的奖励作弊现象。