ZDNet至顶网软件频道消息: 传言已经流传有一段时间了,说微软正计划将自己的Cortana个人数字助理推向下一代主要版本的Windows中。
8月11日,这些传言再次升级,根据Neowin.net的报道,微软内部开发的Threshold——也就是Windows 9——将集成Cortana。Windows Threshold预计将在2015年春季面世。据我的知情人称,微软有可能在今年秋季公开预览Threshold。
与Cortana on Windows Phone 8.1一样,Cortana也将是一个应用,而不是操作系统本身的一部分,Neowin的Brad Sams这样表示。
Cortana这个代号来自于微软Halo系列的一个人工智能角色,它能够学习和适应。Cortana依赖于机器学习技术和“Satori”知识库(为Bing提供强大支撑,以掌握用户希望寻找、追踪和做什么)。Cortana是微软用来对抗谷歌Now和苹果Siri的武器。微软正在扩大Cortana在全球范围内的Alpha和Beta测试项目。
Cortana是微软对未来版本Windows Phone、Windows和Xbox操作系统Shell重塑——核心服务和体验——的核心组成部分。在所有这三个平台上提供Cortana,符合了微软打造“一个微软”的战略目标。
微软从2011年开始就一直在致力于让个人数字助理成为Windows的一部分。微软官方承诺可以实现用户能够告诉他们的PC机“打印Southwest上的登机牌”和让系统自动跳转启动这样的一些场景。这些场景的神奇之处在于结合了微软Bing、Tellme语音技术以及一些自然语言外加社交因素的组合。(微软在2011年底将语音团队纳入在线服务部门下,看似是便于与Bing团队的协作)
一些微软高管表示,微软不太可能在2014年到2016年之间推出这种助理,并声称微软会等待一些进化性而不是变革性的东西就绪了以后,再展示这种新型助理技术。
既然Cortana有可能被列入Threshold功能列表,那么下一次Windows发布将会包括不少新功能和改进。新的迷你开始菜单,能够在桌面上运行Metro风格应用,移除了Charms并包括一个虚拟桌面功能,这些据说都有可能包含在Threshold中。
好文章,需要你的鼓励
这项研究由浙江大学、复旦大学等机构联合完成,提出了ReVisual-R1模型,通过创新的三阶段训练方法显著提升了多模态大语言模型的推理能力。研究发现优化的纯文本冷启动训练、解决强化学习中的梯度停滞问题、以及分阶段训练策略是关键因素。ReVisual-R1在各类推理基准测试中超越了现有开源模型,甚至在某些任务上超过了商业模型,为多模态推理研究开辟了新途径。
这项研究提出了一种名为"批评式微调"的创新方法,证明仅使用一个问题的批评数据就能显著提升大语言模型的推理能力。研究团队对Qwen和Llama系列模型进行实验,发现这种方法在数学和逻辑推理任务上都取得了显著提升,平均提高15-16个百分点,而且只需要强化学习方法1/20的计算资源。这种简单高效的方法为释放预训练模型的潜在推理能力提供了新途径。
新加坡国立大学研究团队开发了名为IEAP的图像编辑框架,它通过将复杂编辑指令分解为简单原子操作序列解决了当前AI图像编辑的核心难题。研究发现当前模型在处理不改变图像布局的简单编辑时表现出色,但在需要改变图像结构时效果差。IEAP框架定义了五种基本操作,并利用思维链推理技术智能分解用户指令,实验证明其性能显著超越现有方法,尤其在处理复杂多步骤编辑时。
Character AI的研究者开发出TalkingMachines系统,通过自回归扩散模型实现实时音频驱动视频生成。研究将预训练视频模型转变为能进行FaceTime风格对话的虚拟形象系统。核心创新包括:将18B参数的图像到视频DiT模型改造为音频驱动系统、通过蒸馏实现无错误累积的无限长视频生成、优化工程设计降低延迟。系统可让多种风格的虚拟角色与人进行自然对话,嘴型与语音同步,为实时数字人交互技术开辟了新可能。