微软已经在星期四推出了Cognitive Toolkit 2.0,从而更新了其人工智能框架。
所有投资深度学习的主流公司都有某种打包软件,可帮助开发人员创建神经网络模型。Google已经有TensorFlow,DeepMind发布了Sonnet,Facebook最近宣布推出Caffe2,而Amazon则推出了MXNet。
微软的版本以前被称为CNTK,该系统在去年十月发布了beta版。新的Cognitive Toolkit 2.0已经扩展到支持Python和Keras,这是一种流行的神经网络API。
考虑到Keras是一个高级框架,这是一个很好的举措,允许研究人员快速实验和建立模型。 “(它)抽象了大多数用户不需要了解的许多细节,”使用户免于面对混乱的代码行,Keras的作者及谷歌的工程师François Chollet之前对《The Register》做出了这样的解释。
微软人工智能的优势在于语音识别。去年,由微软首席语音科学家Xuedong Huang(音译:黄学东)率领的团队宣布,他们创立了一个能够以“等同于人类”水平对语音进行抄录的系统。
这个Cognitive Toolkit特别适用于自然语言处理中常用的复现神经网络和长的短期记忆网络,这并不奇怪。微软使开发人员更轻松地使用Keras分支到不同类型的神经网络。
它还将包括Java语言绑定和压缩经过训练的模型的新工具,这样在运行诸如图像识别等应用程序时所需的资源就更少。
它已经被应用于像Cortana这样的内部应用程序,这是微软的数字助理,也是微软让人工智能变得更容易访问这个更广泛的目标的一部分。
该工具包是开源的,可以在这里(https://github.com/microsoft/cntk)找到。
好文章,需要你的鼓励
微软在Edge浏览器中推出了名为"Copilot Mode"的新功能,让用户在AI助手的帮助下浏览网页。该AI助手能理解用户的研究内容,预测用户需求并代为执行操作。目前该功能仍为实验性质,默认需用户主动开启且免费提供给Mac和PC用户使用。功能包括搜索、聊天、网页导航辅助等,还能处理预约、购物清单制作等任务,并可作为研究伙伴查看所有打开的标签页进行产品比较或在线研究。
上海AI实验库推出YUME系统,用户只需输入一张图片就能创建可键盘控制的虚拟世界。该系统采用创新的运动量化技术,将复杂的三维控制简化为WASD键操作,并通过智能记忆机制实现无限长度的世界探索。系统具备强大的跨风格适应能力,不仅能处理真实场景,还能重现动漫、游戏等各种艺术风格的虚拟世界,为虚拟现实和交互娱乐领域提供了全新的技术路径。
Copilot+ PC在企业市场渗透缓慢,IT决策者对其专有Windows AI功能印象一般。尽管微软推出了配备NPU芯片、支持40+ TOPS算力的高端笔记本,但企业更关注Windows 11设备更新等优先事项。分析显示,2025年第二季度欧洲AI PC出货量中,Copilot+ PC仅占9%。其专有功能如Recall、Click to Do等主要面向消费者,对企业价值有限。企业购买此类设备更多是基于硬件升级周期和对未来AI应用的投资,而非当前AI功能需求。
上海AI实验室研究团队开发了革命性的AI编程验证方法,让大语言模型能够在最小人工干预下自动生成和验证程序规范。该方法摒弃传统的人工标注训练,采用强化学习让模型在形式化语言空间中自主探索,在Dafny编程验证任务上显著超越现有方法,为AI自主学习开辟新道路。