ZD至顶网软件频道消息:过去几年里,微软围绕着全息计算的前景做了很多展示,也说了很多。但现在是时候,微软向用户证实为什么让Windows成为3D领域的中心,他们则会因此受益。
下周,10月26日,在该公司举办的Windows和硬件的活动上,微软的官员们可能准备尝试这样去做。Windows10 RedStone 2—— Windows 10的下一次重大更新——将是整个活动的中心。
我们都已经知道在RedStone 2中——预计将在2017年3月份全面推出,微软计划将Windows Holographic外壳添加到Windows 10桌面操作系统之中。(我听说这项工作的代码代号为“Oasis”。)这将让Windows 10 PCs能够同微软希望推出的各类支持Windows Holographic的设备协同工作。
但是把Windows Holographic/3D体验带给个人电脑对那些想要的不仅仅是通过增强现实/虚拟现实头戴设备看到全息图景的用户来说有什么用呢?
当然,你已经可以和你的日历进行交互,并且使用微软的HoloLens眼镜进行Skype通话。但是微软需要明确为什么全息计算将能够让Windows用户变得更有效率。为什么以及如何在3D环境中(或者在一个混合了2D和3D的环境中)使用PowerPoint、Excel或者PowerBI, 这种做法为什么会比只在2D环境中使用这些应用程序更好?微软是否会推出能够让用户爱上Windows Holographic PCs以及设备的新一代3D应用程序?
我认为Windows和设备团队可以实现这一点的方式之一是通过本月早些时候泄露出来的3D版本的微软Paint。我的消息来源告诉我,3D版本的Paint也被称为“Beihai”。(我在一月份的时候在文章中谈到过“Beihai”这个代码代号,指出这是一个由开发Skype for HoloLens的团队开发的消费应用程序。)
WalkingCat(推特上的@h0x0d)最近发现了一个Beihai发布的视频脚本。这个脚本也提到了3D PowerPoint。
想想看吧。即将到来的3D版本的Paint可以提供一种创建并修改3D对象的简单方法,和现有的Paint版本允许用户创建2D对象的方式相同。如果消费者们可以使用3D打印机打印你的创建的3D Paint对象,哇!现在3D Windows就让你变得更具创造力和生产力了。
WalkingCat最近还发现了一份Chris Pratley的简历,他现在是“Evoke的Studio经理”,这是一个“微软Windows和设备集团中创造性的媒体应用团队。” Pratley更新的简历表示,微软Evoke Studio团队在针对手机、PC和云开发照片、视频和“3D讲故事的工具和体验”。如果Evoke是微软希望在其10月26日主题为“想象一下(有了3D)你将能够做什么”的活动中尝试的另一种方式,我可丝毫不会感到惊讶。
我在一个月之前听说微软正在计划在10月26日的活动上向用户展示,如何“将你的桌面电脑变成一间工作室(Studio)”。也许这句话有多种含义……
好文章,需要你的鼓励
这项研究由德累斯顿工业大学等机构的研究团队完成,旨在解决主动学习未被广泛应用的问题。研究者构建了包含460万种超参数组合的实验网格,系统分析了各参数对主动学习性能的影响。研究发现,不同策略实现间存在显著差异,基于边缘的不确定性策略整体表现最佳,随机选择约4000个超参数组合即可获得可靠结果。这些发现为设计可重现、可信赖的主动学习实验提供了明确指导,有助于降低入门门槛,促进技术在实际应用中的普及。
这项由英国爱丁堡大学和上海人工智能实验室研究者共同完成的工作提出了LongBioBench,一种用于评估长文本语言模型的新型基准测试框架。通过使用人工生成的虚构人物传记作为测试环境,该框架在保持可控性的同时,提供了更真实的评估场景。研究对18个长文本模型的测试表明,即使最先进的模型在检索、推理和可信任性方面仍存在显著挑战,特别是上下文长度增加时。研究还揭示了现有合成基准测试的设计缺陷和长上下文预训练的局限性,为未来模型开发提供了重要指导。
SuperWriter是一项来自新加坡科技设计大学和清华大学的突破性研究,通过模仿人类"先思考后写作"的过程,彻底改良了AI长文生成能力。该研究团队开发的框架包含三个关键阶段:规划、写作和修改,使AI能像专业作家一样进行结构化思考。实验结果表明,经过训练的SuperWriter-LM模型不仅超越同等规模的所有AI模型,甚至在某些领域表现优于规模更大的顶级模型,为AI辅助写作开创了新的可能性。
香港大学与阿里巴巴达摩院合作开发的LayerFlow是一种突破性的层级视频生成技术,能同时生成透明前景、完整背景和混合场景视频。该技术通过创新的框架设计将不同视频层级作为子片段连接,并引入层级嵌入使模型区分各层级。面对高质量训练数据稀缺的挑战,研究团队设计了三阶段训练策略,结合Motion LoRA和Content LoRA,实现了图像和视频数据的联合训练。LayerFlow不仅支持多层视频生成,还能实现视频分解和条件层生成,为视频创作领域带来革命性变革。