至顶网软件频道消息: 微软继续在其整个产品组合中添加混合现实和人工智能功能,并为Office 365商业用户提供新的“SharePoint Spaces”功能。
微软正致力于通过“SharePoint Spaces”预览版为其所有的产品带来混合现实和人工智能功能,并为SharePoint和OneDrive提供新的人工智能增强功能。
SharePoint Spaces将允许SharePoint用户创建和使用混合现实的3D“空间”,如上图中的空间,在这些空间中可以看到数据和产品模型并与之交互。微软于5月21日在SharePoint北美大会的开场主题演讲中推出了这项新技术。
要查看/操作混合现实SharePoint空间,用户可以——但不是必须——使用HoloLens增强现实或其他类型的Windows混合现实头戴设备。微软正在设计SharePoint Spaces,以便不用头戴设备就可以在浏览器中工作。
微软正在宣传潜在的SharePoint Spaces使用场景,包括招聘和入职、产品开发和培训/学习,所有这些都是很好的例子,说明微软是如何重新强调HoloLens的商业聚焦应用程序和混合现实的(这是在消费者应用程序中过分推动这项技术之后的回调)。
微软的新消息是混合现实将成为其整体“现代工作场所”战略的关键部分。在本月早些时候的Build大会上,微软推出了两款专为工作场景设计的新型混合现实应用程序:Layout和Remote Assist。虽然我认为企业比普通消费者更倾向于采用混合现实技术,但是我仍然很好奇,想看看它在微软之外的真实世界是不是能够真的获得动力。
微软正计划为任何拥有Office 365商业(企业)计划的人提供SharePoint Spaces选项。有了它,用户可以使用模板来创建混合现实环境,他们可以添加其存储在SharePoint中的2D文件、3D视频、文档和其他数据。客户和合作伙伴今天可以申请参加SharePoint Spaces的早期有限预览。
在人工智能方面,微软的官员们正在宣传OneDrive和SharePoint新增加的功能将为这些产品“注入”人工智能功能。
从6月开始,微软将为OneDrive移动应用添加一个新的“扫描”(Scan)按钮,以便用户快速抓取照片、图片、白板和名片。用户还将获得(在9月份的Ignite之前的某个时间)一个选项,可以通过OneDrive将照片自动上传到Office 365,用户可以在其中确定拍摄照片的时间/地点,识别对象并从中提取文本,并且可以在这些照片中搜索图像。
微软的官员们今天还透露,SharePoint Server 2019将在六月份提供公开预览。正如该公司的高官们之前指出的那样,SharePoint Server 2019是SharePoint的下一个内部部署版本,其中将包括SharePoint Online的用户已经在使用的功能,包括对“现代”Team网站、通信站点、列表、库和页面的支持。SharePoint Server还将使客户能够用和SharePoint Online一致的方式使用SharePoint Framework来构建应用程序。
微软的官员们表示, SharePoint Server 2019预计将在2018日历年结束之前全面上市。
好文章,需要你的鼓励
韩国科学技术院研究团队提出"分叉-合并解码"方法,无需额外训练即可改善音视频大语言模型的多模态理解能力。通过先独立处理音频和视频(分叉阶段),再融合结果(合并阶段),该方法有效缓解了模型过度依赖单一模态的问题,在AVQA、MUSIC-AVQA和AVHBench三个基准测试中均取得显著性能提升,特别是在需要平衡音视频理解的任务上表现突出。
这项研究利用大语言模型解决科学新颖性检测难题,南洋理工大学团队创新性地构建了闭合领域数据集并提出知识蒸馏框架,训练轻量级检索器捕捉想法层面相似性而非表面文本相似性。实验表明,该方法在市场营销和NLP领域显著优于现有技术,为加速科学创新提供了有力工具。
un?CLIP是一项创新研究,通过巧妙反转unCLIP生成模型来增强CLIP的视觉细节捕捉能力。中国科学院研究团队发现,虽然CLIP在全局图像理解方面表现出色,但在捕捉细节时存在不足。他们的方法利用unCLIP生成模型的视觉细节表示能力,同时保持与CLIP原始文本编码器的语义对齐。实验结果表明,un?CLIP在MMVP-VLM基准、开放词汇语义分割和视觉中心的多模态任务上显著优于原始CLIP和现有改进方法,为视觉-语言模型的发展提供了新思路。
这项研究介绍了RPEval,一个专为评估大语言模型角色扮演能力而设计的新基准。研究团队从法国里尔大学开发的这一工具专注于四个关键维度:情感理解、决策制定、道德对齐和角色一致性,通过单轮交互实现全自动评估。研究结果显示Gemini-1.5-Pro在总体表现上领先,而GPT-4o虽在决策方面表现出色,但在角色一致性上存在明显不足。这一基准为研究人员提供了一个可靠、可重复的方法来评估和改进大语言模型的角色扮演能力。