ZD至顶网软件频道消息:过去几年里,微软围绕着全息计算的前景做了很多展示,也说了很多。但现在是时候,微软向用户证实为什么让Windows成为3D领域的中心,他们则会因此受益。
下周,10月26日,在该公司举办的Windows和硬件的活动上,微软的官员们可能准备尝试这样去做。Windows10 RedStone 2—— Windows 10的下一次重大更新——将是整个活动的中心。
我们都已经知道在RedStone 2中——预计将在2017年3月份全面推出,微软计划将Windows Holographic外壳添加到Windows 10桌面操作系统之中。(我听说这项工作的代码代号为“Oasis”。)这将让Windows 10 PCs能够同微软希望推出的各类支持Windows Holographic的设备协同工作。
但是把Windows Holographic/3D体验带给个人电脑对那些想要的不仅仅是通过增强现实/虚拟现实头戴设备看到全息图景的用户来说有什么用呢?
当然,你已经可以和你的日历进行交互,并且使用微软的HoloLens眼镜进行Skype通话。但是微软需要明确为什么全息计算将能够让Windows用户变得更有效率。为什么以及如何在3D环境中(或者在一个混合了2D和3D的环境中)使用PowerPoint、Excel或者PowerBI, 这种做法为什么会比只在2D环境中使用这些应用程序更好?微软是否会推出能够让用户爱上Windows Holographic PCs以及设备的新一代3D应用程序?
我认为Windows和设备团队可以实现这一点的方式之一是通过本月早些时候泄露出来的3D版本的微软Paint。我的消息来源告诉我,3D版本的Paint也被称为“Beihai”。(我在一月份的时候在文章中谈到过“Beihai”这个代码代号,指出这是一个由开发Skype for HoloLens的团队开发的消费应用程序。)
WalkingCat(推特上的@h0x0d)最近发现了一个Beihai发布的视频脚本。这个脚本也提到了3D PowerPoint。
想想看吧。即将到来的3D版本的Paint可以提供一种创建并修改3D对象的简单方法,和现有的Paint版本允许用户创建2D对象的方式相同。如果消费者们可以使用3D打印机打印你的创建的3D Paint对象,哇!现在3D Windows就让你变得更具创造力和生产力了。
WalkingCat最近还发现了一份Chris Pratley的简历,他现在是“Evoke的Studio经理”,这是一个“微软Windows和设备集团中创造性的媒体应用团队。” Pratley更新的简历表示,微软Evoke Studio团队在针对手机、PC和云开发照片、视频和“3D讲故事的工具和体验”。如果Evoke是微软希望在其10月26日主题为“想象一下(有了3D)你将能够做什么”的活动中尝试的另一种方式,我可丝毫不会感到惊讶。
我在一个月之前听说微软正在计划在10月26日的活动上向用户展示,如何“将你的桌面电脑变成一间工作室(Studio)”。也许这句话有多种含义……
好文章,需要你的鼓励
这项由加州大学圣地亚哥分校和微软研究院合作开发的REAL框架,通过程序分析反馈训练大型语言模型生成高质量代码。与传统方法不同,REAL采用强化学习将代码安全性和可维护性作为奖励信号,不依赖人工标注或特定规则。研究在多个数据集上的实验表明,REAL在保证功能正确性的同时显著提高了代码质量,有效解决了"即兴编程"中的安全漏洞和维护性问题,为AI辅助编程提供了新的范式。
加州大学伯克利分校与Meta FAIR研究团队开发了"Self-Challenging"框架,让大语言模型通过自己创建和解决任务来提升能力。该方法引入创新的"Code-as-Task"格式,包含指令、验证函数、示例解决方案和失败案例,确保生成的任务既可行又有挑战性。在工具计算、网页浏览、零售服务和航班预订四种环境测试中,仅使用自生成训练数据,Llama-3.1-8B模型性能提升了两倍多,证明AI可以通过自我挑战实现有效学习,减少对人类标注的依赖。
南洋理工大学与SenseTime Research合作提出了PoseFuse3D-KI,一种创新的人体中心关键帧插值框架。该方法将3D人体模型信息融入扩散过程,解决了现有技术在处理复杂人体动作时产生扭曲结果的问题。研究团队开发了专门的SMPL-X编码器直接从3D空间提取几何信息,并设计了融合网络将3D线索与2D姿态无缝整合。他们还构建了CHKI-Video数据集,包含2,614个视频片段及完整的人体标注。实验结果显示,PoseFuse3D-KI在PSNR上提升9%,LPIPS减少38%,显著超越现有方法。
这项研究提出了LongGuide算法,解决了大型语言模型在长文本生成任务中的局限性。研究团队发现,仅依靠上下文学习无法使模型充分掌握文本的语言和格式特性。LongGuide通过自动生成两种指导原则:度量指导原则和输出约束指导原则,显著提升了模型性能。在七种长文本生成任务中,该方法使开源和闭源模型的ROUGE-L评分平均提高约6%。LongGuide具有通用性强、易于学习、成本效益高等优点,为提升AI长文本生成能力提供了新方向。