ZDNet至顶网软件频道消息:过去十多年微软一直致力于用于设备的软件。微软已经向市场中推出了从车载娱乐系统、销售终端、咖啡机到智能手表等一切事物的软件。现在,微软正在着手重塑其物联网(IoT)产品、服务和战略,而这远不止是嵌入式Windows。
微软正在构建一系列由Azure提供强大支撑的服务,利用、管理和发挥这些来自传感器以及物联网设备的数据的价值。微软有望推出自己的物联网新设备和服务,从眼镜和手表之类的可穿戴设备到家庭自动化系统及服务。
以下是微软在物联网方面的战略计划:
嵌入式Windows团队是微软新物联网团队的核心。
到目前为止,微软的嵌入式Windows团队将精力主要集中于企业和行业客户而不是消费者身上,试图说服零售、医疗、制造和汽车行业的客户在他们的设备中嵌入各种版本的Windows。
但是嵌入式Windows团队现在已经正式变身为微软的物联网团队。这个物联网团队的任务不仅仅是Windows。事实上,这个团队覆盖了所有种类的操作系统系统,甚至包括Linux,使得微软深入渗透到嵌入式设备中。
微软Azure云也将在微软物联网战略中扮演重要角色。尽管嵌入式操作系统是物联网的关键,但后端同样重要。对于微软来说,物联网的后端就是它的Azure云操作系统。
在微软的物联网愿景中,各种设备都将通过Azure连接。发展物联网服务的人可以构建这些服务使其运行并扩展到Azure。
数据分析是微软物联网战略将要提供的服务之一。
在4月初,微软宣布有限预览微软Azure智能系统服务。这项服务让用户能够捕捉并管理来自传感器和设备的机器数据。
企业将能够利用微软的数据分析工具,例如HD Insight、Azure Hadoop服务、Power BI、微软业务智能服务,捕捉和分析来自这项服务的数据。
微软还将致力于更低等级、基于Azure的服务用于物联网通信。
微软还将开发一项(也可能是多项)更低等级的Azure服务以促进物联网通信。
其中一项服务是构建与Azure服务总线通信功能,主要针对与物联网相关的无数传感器和设备之间的通信。微软还没有正式公布这项服务,预计将采用一种代号为“Raykjavik”(雷克雅未克)的网关,用于将信息发送到设备并收集来自这些设备的信息。
云正在逼近冰岛的雷克雅未克。
消费类产品也是微软物联网团队的方向。微软正在研发可穿戴设备——这可能包括新的智能手表,以及各种类型的智能眼镜。
在四月举办的Build 2014上,微软物联网团队介绍了公司的汽车嵌入式平台是如何进化为更具连接性的"Connected Car"平台的,这个概念听起来很像苹果的CarPlay。
微软的物联网团队正在建立开放的系统和云设备用来驱使那些非PC设备,可穿戴设备,汽车,及消费电子产品等等。微软物联网团队在LinkedIn上表示,“我们的智能系统是建立在众多垂直行业上的。”
家庭自动化和其他研究型项目也将成为微软物联网战略的一部分。
微软目前还没有提供向Nest恒温器这样的设备,但是在家庭自动化领域并非新进者。
微软研究院4年来一直致力于各种家庭自动化研究项目,包括HomeOS、家庭应用商店等等。有传闻说微软可能会利用其id8 R2 Studios收购来加强Xbox,这样就可以成为一个重要自动化指挥与控制系统。
不过微软研究项目并不总会转换成商业化产品,最近几年的趋势是,微软想办法尽可能地把MSR技术融入很多产品当中。
好文章,需要你的鼓励
韩国科学技术院研究团队提出"分叉-合并解码"方法,无需额外训练即可改善音视频大语言模型的多模态理解能力。通过先独立处理音频和视频(分叉阶段),再融合结果(合并阶段),该方法有效缓解了模型过度依赖单一模态的问题,在AVQA、MUSIC-AVQA和AVHBench三个基准测试中均取得显著性能提升,特别是在需要平衡音视频理解的任务上表现突出。
这项研究利用大语言模型解决科学新颖性检测难题,南洋理工大学团队创新性地构建了闭合领域数据集并提出知识蒸馏框架,训练轻量级检索器捕捉想法层面相似性而非表面文本相似性。实验表明,该方法在市场营销和NLP领域显著优于现有技术,为加速科学创新提供了有力工具。
un?CLIP是一项创新研究,通过巧妙反转unCLIP生成模型来增强CLIP的视觉细节捕捉能力。中国科学院研究团队发现,虽然CLIP在全局图像理解方面表现出色,但在捕捉细节时存在不足。他们的方法利用unCLIP生成模型的视觉细节表示能力,同时保持与CLIP原始文本编码器的语义对齐。实验结果表明,un?CLIP在MMVP-VLM基准、开放词汇语义分割和视觉中心的多模态任务上显著优于原始CLIP和现有改进方法,为视觉-语言模型的发展提供了新思路。
这项研究介绍了RPEval,一个专为评估大语言模型角色扮演能力而设计的新基准。研究团队从法国里尔大学开发的这一工具专注于四个关键维度:情感理解、决策制定、道德对齐和角色一致性,通过单轮交互实现全自动评估。研究结果显示Gemini-1.5-Pro在总体表现上领先,而GPT-4o虽在决策方面表现出色,但在角色一致性上存在明显不足。这一基准为研究人员提供了一个可靠、可重复的方法来评估和改进大语言模型的角色扮演能力。