至顶网软件频道消息:我相信,从2015年以来,微软到目前为止还没有发布一部纪录片风格的“Productivity Future(生产力的未来)”的视频。但这并不意味着公司已经停止了“设想”办公室和工作场所下一步的未来。
在一个新的Microsoft .Future播客剧集——它的名字是“人工智能能够如何使会议变得不那么痛苦”——中,微软对于最终可能影响其未来产品和服务(包括Cortana)的一些最新的未来概念给出了一些暗示。
播客(只有音频)提到了办公室设想总监Anton Andrews及其团队“重新设想了一切——从擦干净白板上的内容到对地板的预期。”
Andrews在播客期间表示,微软将人们站立的地板视为一种可能的沟通工具,但他没有详细说明如何/何时/是否公司会为它提供更多的意义。微软研究院已经在努力通过RoomAlive项目,将用户体验投射到各种表面,包括地板上。
Andrews表示:“地板是一个界面。”他表示,“而且,这个想法并不是那么多,地板从某种意义上只是活动的地板。但这里的想法是我们可以规划和设计地板。”
微软过去曾经发布过其他的视频系列,就像2016年初的一样,这些都是关于未来的工作是什么样子的。今年早些时候,该公司也与Steelcase合作,推出了与Surface设备(包括Surface Hubs和Surface Studios)配套的新型办公家具。
本周播客中提到的Andrews设想的未来办公室在角落里,圆顶看起来像一个木质的冰屋骨架,是一个会议室的原型。这个房间是由吸音毡制成的(不是Alcantara,风扇的声音会有影响)。原型会议室旨在测试没有大型矩形桌的圆形房间可能会如何影响人们的互动方式。
显然,会议室原型还有一种让人按下按钮得到Cortana迎接的方式。播客没有详细说明这个按钮的位置(Skype Room Systems?下一代Surface Hub?Harman-Kardon扬声器?)
这个播客中表示,Cortana会询问,“你好,你想加入你已经安排好的会议吗?”然后Cortana询问领导人是否希望Cortana参加会议。
在接受后,Andrews在播客中“演示了Cortana如何在电话会议中工作:围绕房间边缘放置的屏幕通过视频通话将我们连接到远程办公室。”
Cortana可以选择记录会议中的所有内容,推荐用户提及的文件,并将其附加到记录中,甚至“悄悄地提醒您参加电话会议人员的姓名。”
微软一直在努力使用数字助理——不仅仅是Cortana,还有在雷德蒙德园区使用的早期原型 ——有用的工具。
微软的AI+研究小组正在研究下一代“语境智能助手”。不要忘了:微软一年前就在那里购买了人工智能调度助理公司Genee……一个名为Dictate的新的微软车库项目最近向Office应用添加了语音到文本的转化功能。
此外,该公司一直致力于为Skype翻译器和PowerPoint(最近的Presentation Translator加载项)添加更多智能,以支持播客中提到的某些场景。考虑到微软期待Skype for Business能够出彩,该公司也许会在即将到来的Ignite展会上公开Skype Meeting Broadcasts的下一步。
过去十年里,微软设想视频虽然更多的是概念性和灵感性的内容,但经常提供有关未来产品的提示。在过去的视频中,Home Hub Windows功能和Surface Studio都有过一些预示。
好文章,需要你的鼓励
这项由加州大学圣地亚哥分校和微软研究院合作开发的REAL框架,通过程序分析反馈训练大型语言模型生成高质量代码。与传统方法不同,REAL采用强化学习将代码安全性和可维护性作为奖励信号,不依赖人工标注或特定规则。研究在多个数据集上的实验表明,REAL在保证功能正确性的同时显著提高了代码质量,有效解决了"即兴编程"中的安全漏洞和维护性问题,为AI辅助编程提供了新的范式。
加州大学伯克利分校与Meta FAIR研究团队开发了"Self-Challenging"框架,让大语言模型通过自己创建和解决任务来提升能力。该方法引入创新的"Code-as-Task"格式,包含指令、验证函数、示例解决方案和失败案例,确保生成的任务既可行又有挑战性。在工具计算、网页浏览、零售服务和航班预订四种环境测试中,仅使用自生成训练数据,Llama-3.1-8B模型性能提升了两倍多,证明AI可以通过自我挑战实现有效学习,减少对人类标注的依赖。
南洋理工大学与SenseTime Research合作提出了PoseFuse3D-KI,一种创新的人体中心关键帧插值框架。该方法将3D人体模型信息融入扩散过程,解决了现有技术在处理复杂人体动作时产生扭曲结果的问题。研究团队开发了专门的SMPL-X编码器直接从3D空间提取几何信息,并设计了融合网络将3D线索与2D姿态无缝整合。他们还构建了CHKI-Video数据集,包含2,614个视频片段及完整的人体标注。实验结果显示,PoseFuse3D-KI在PSNR上提升9%,LPIPS减少38%,显著超越现有方法。
这项研究提出了LongGuide算法,解决了大型语言模型在长文本生成任务中的局限性。研究团队发现,仅依靠上下文学习无法使模型充分掌握文本的语言和格式特性。LongGuide通过自动生成两种指导原则:度量指导原则和输出约束指导原则,显著提升了模型性能。在七种长文本生成任务中,该方法使开源和闭源模型的ROUGE-L评分平均提高约6%。LongGuide具有通用性强、易于学习、成本效益高等优点,为提升AI长文本生成能力提供了新方向。