ZD至顶网软件频道消息:过去几年里,微软围绕着全息计算的前景做了很多展示,也说了很多。但现在是时候,微软向用户证实为什么让Windows成为3D领域的中心,他们则会因此受益。
下周,10月26日,在该公司举办的Windows和硬件的活动上,微软的官员们可能准备尝试这样去做。Windows10 RedStone 2—— Windows 10的下一次重大更新——将是整个活动的中心。
我们都已经知道在RedStone 2中——预计将在2017年3月份全面推出,微软计划将Windows Holographic外壳添加到Windows 10桌面操作系统之中。(我听说这项工作的代码代号为“Oasis”。)这将让Windows 10 PCs能够同微软希望推出的各类支持Windows Holographic的设备协同工作。
但是把Windows Holographic/3D体验带给个人电脑对那些想要的不仅仅是通过增强现实/虚拟现实头戴设备看到全息图景的用户来说有什么用呢?
当然,你已经可以和你的日历进行交互,并且使用微软的HoloLens眼镜进行Skype通话。但是微软需要明确为什么全息计算将能够让Windows用户变得更有效率。为什么以及如何在3D环境中(或者在一个混合了2D和3D的环境中)使用PowerPoint、Excel或者PowerBI, 这种做法为什么会比只在2D环境中使用这些应用程序更好?微软是否会推出能够让用户爱上Windows Holographic PCs以及设备的新一代3D应用程序?
我认为Windows和设备团队可以实现这一点的方式之一是通过本月早些时候泄露出来的3D版本的微软Paint。我的消息来源告诉我,3D版本的Paint也被称为“Beihai”。(我在一月份的时候在文章中谈到过“Beihai”这个代码代号,指出这是一个由开发Skype for HoloLens的团队开发的消费应用程序。)
WalkingCat(推特上的@h0x0d)最近发现了一个Beihai发布的视频脚本。这个脚本也提到了3D PowerPoint。
想想看吧。即将到来的3D版本的Paint可以提供一种创建并修改3D对象的简单方法,和现有的Paint版本允许用户创建2D对象的方式相同。如果消费者们可以使用3D打印机打印你的创建的3D Paint对象,哇!现在3D Windows就让你变得更具创造力和生产力了。
WalkingCat最近还发现了一份Chris Pratley的简历,他现在是“Evoke的Studio经理”,这是一个“微软Windows和设备集团中创造性的媒体应用团队。” Pratley更新的简历表示,微软Evoke Studio团队在针对手机、PC和云开发照片、视频和“3D讲故事的工具和体验”。如果Evoke是微软希望在其10月26日主题为“想象一下(有了3D)你将能够做什么”的活动中尝试的另一种方式,我可丝毫不会感到惊讶。
我在一个月之前听说微软正在计划在10月26日的活动上向用户展示,如何“将你的桌面电脑变成一间工作室(Studio)”。也许这句话有多种含义……
好文章,需要你的鼓励
这项研究介绍了VisCoder,一个经过专门微调的大语言模型,用于生成可执行的Python可视化代码。研究团队创建了包含20万样本的VisCode-200K数据集,结合了可执行代码示例和多轮修正对话。在PandasPlotBench基准测试中,VisCoder显著优于同等规模的开源模型,甚至在某些方面超越了GPT-4o-mini。研究还引入了自我调试评估模式,证明了反馈驱动学习对提高代码可执行性和视觉准确性的重要性。
这项研究提出了"适应再连续学习"(ACL)框架,一种创新的方法解决预训练模型在连续学习中的稳定性-可塑性困境。通过在学习新任务前先对模型进行适应性调整,ACL使模型既能更好地学习新知识(提高可塑性),又能保留已有知识(维持稳定性)。实验证明,该框架能显著提升各种连续学习方法的性能,为解决人工智能系统中的"灾难性遗忘"问题提供了有效途径。
这篇研究首次关注了CLIP模型文本编码器的对抗鲁棒性问题,提出了LEAF方法(Levenshtein高效对抗性微调)来增强文本编码器的稳健性。实验表明,LEAF显著提高了模型在面对文本扰动时的性能,在AG-News数据集上将对抗准确率从44.5%提升至63.3%。当集成到Stable Diffusion等文本到图像生成模型中时,LEAF显著提高了对抗噪声下的生成质量;在多模态检索任务中,它平均提高了10个百分点的召回率。此外,LEAF还增强了模型的可解释性,使文本嵌入的反演更加准确。
BenchHub是由韩国KAIST和Yonsei大学研究团队开发的统一评估平台,整合了38个基准中的30万个问题,按技能、学科和目标类型进行精细分类。研究显示现有评估基准存在领域分布偏差,而BenchHub通过自动分类系统和用户友好界面,让用户能根据特定需求筛选评估数据。实验证明模型在不同领域的排名差异巨大,强调了定制化评估的重要性。该平台支持多语言扩展和领域特化,为研究人员和开发者提供了灵活评估大语言模型的强大工具。