微软和Amazon之间的合作很快将不仅仅局限在云和个人助理方面,很快将拓展到医疗保健领域。
CNBC最近的一份报告显示,Amazon有一个秘密的健康技术团队一直在致力于医疗记录、虚拟医生访问以及Amazon Echo等设备的健康应用。
对于那些可能已经忘记(或从来不知道)的人来说,微软多年来也通过其HealthVault病历记录服务瞄准了这些相同的领域。今年早些时候,微软通过一个新的Insights研究项目扩展了HealthVault,旨在为用户提供有关患者健康的分析。
微软的AI + Research Group通过和外部合作伙伴合作,整合研究和健康技术产品开发,在Healthcare NExT进行了努力。
从最近微软的招聘启事中可以看到对HealthCare NExT的描述是:
“我们的团队致力于实现未来个人健康与微软健康技术产品的对话。我们的目标是通过例如穿戴式传感器和医疗护理提供者来获得‘大数据’,通过让医疗保健服务变得更加积极主动和更全面来改变医疗保健的现状。作为一个经验驱动的团队,我们的目标是推动人们健康和保健的积极变化。”
这篇文章中提到的“将改变医疗保健的服务”可能就是微软Health。
去年,当微软最近似乎终止了微软手环等健身硬件产品服务时,该公司的官员们表示,Microsoft Health service并没有消失。该计划似乎是使Microsoft Health成为获得健康和健身洞察力的服务,无论其连接到哪种类型的设备和平台。
就在今天——7月27日,微软宣布为Cortana提供Fitbit能力,旨在帮助用户跟踪他们的健康和健身目标。 Cortana Fitbit能力将与Windows 10、安卓、iOS以及“即将推出”的Cortana支持的Harman Kardon Invoke扬声器配合使用。
微软还开发了一些其他新的卫生研究项目。
InnerEye项目是微软“人工智能支持”的放射治疗规划软件工具。有一个Microsoft AI Health Chatbot(微软人工智能健康聊天机器人)项目旨在帮助合作伙伴建立自己的健康聊天机器人。在Cortana Intelligence Gallery,微软拥有许多机器学习健康相关产品,用于检测和预测疾病,监测患者活动并预测住院和再入院。
十多年前,微软在医疗保健领域始终走了一条与众不同的路径。该公司收购了医疗保健公司并雇用医生在公司工作。但该公司最终出售了旗下许多医疗保健资产,并剥离了大部分的相关员工。
去年,微软将其Caradigm的50%股权出售给了GE Healthcare,双方在该项目上是合资关系。微软几乎将之前隶属于其Health Services Group所有的几百个人以及很多产品都划归给了Caradigm。(HealthVault服务和团队是个例外,它仍然是微软的一部分。)
微软已经转移到Caradigm的技术是医院和Sentillion医疗保健身份管理产品的Amalga数据汇总系统。 GE正在为新的合资企业提供旗下几款医疗保健软件产品。微软于2010年12月收购了Sentillion。Amalga是微软于2006年收购的Azyxxi的资产。
微软正在继续关注医疗保健行业,作为少数几个与经销商合作的垂直行业之一,并开创了非常令人瞩目的业绩。
好文章,需要你的鼓励
韩国科学技术院研究团队提出"分叉-合并解码"方法,无需额外训练即可改善音视频大语言模型的多模态理解能力。通过先独立处理音频和视频(分叉阶段),再融合结果(合并阶段),该方法有效缓解了模型过度依赖单一模态的问题,在AVQA、MUSIC-AVQA和AVHBench三个基准测试中均取得显著性能提升,特别是在需要平衡音视频理解的任务上表现突出。
这项研究利用大语言模型解决科学新颖性检测难题,南洋理工大学团队创新性地构建了闭合领域数据集并提出知识蒸馏框架,训练轻量级检索器捕捉想法层面相似性而非表面文本相似性。实验表明,该方法在市场营销和NLP领域显著优于现有技术,为加速科学创新提供了有力工具。
un?CLIP是一项创新研究,通过巧妙反转unCLIP生成模型来增强CLIP的视觉细节捕捉能力。中国科学院研究团队发现,虽然CLIP在全局图像理解方面表现出色,但在捕捉细节时存在不足。他们的方法利用unCLIP生成模型的视觉细节表示能力,同时保持与CLIP原始文本编码器的语义对齐。实验结果表明,un?CLIP在MMVP-VLM基准、开放词汇语义分割和视觉中心的多模态任务上显著优于原始CLIP和现有改进方法,为视觉-语言模型的发展提供了新思路。
这项研究介绍了RPEval,一个专为评估大语言模型角色扮演能力而设计的新基准。研究团队从法国里尔大学开发的这一工具专注于四个关键维度:情感理解、决策制定、道德对齐和角色一致性,通过单轮交互实现全自动评估。研究结果显示Gemini-1.5-Pro在总体表现上领先,而GPT-4o虽在决策方面表现出色,但在角色一致性上存在明显不足。这一基准为研究人员提供了一个可靠、可重复的方法来评估和改进大语言模型的角色扮演能力。