ZD至顶网软件频道消息: IBM旨在让Watson成为初级保健医生的帮手,它扩展了其认知计算的涉足领域。
在Health Information Management Systems Society(HIMSS)大会上,IBM介绍了将Watson连接到基本、急性和行为数据以全面了解患者的计划。而初级保健供应商之间的连接正在Central New York的一个包括了六个县的地区和超过2000个供应商推出。
同时,位于马萨诸塞州的Atrius Health将把IBM的认知计算工具嵌入其针对初级保健供应商的电子医疗记录工作流之中。
首席执行官Ginny Rometty在大会上发表了主题演讲,该演讲透露了关于Watson医疗保健新闻。 Rometty将介绍区块链技术如何在医疗保健和Watson的最新发展中发挥作用。
在产品方面,IBM表示它正在通过符合HIPAA的数据平台即服务,新版本和数据中心位置来提高其Watson Health云计算的效能。
据了解,IBM的Watson Platform for Health专为健康和生命科学公司设计,能够为医疗保健领域的业务主管和数据科学家工作。它还将支持HIPAA移动应用程序、合规性工具和基于Watson的服务来梳理非结构化数据,例如医生的笔记。
此外,IBM推出了Watson Health Consulting部门,帮助医疗保健供应商使用机器学习、数据科学和分析。
好文章,需要你的鼓励
NAVER和KAIST研究团队发现,先进AI模型在数学题自我修正方面存在严重缺陷。他们创建的MMRefine基准测试揭示,即使是GPT-4O等顶级模型也只能成功修正约23%的错误答案,而且经常将正确答案改错。研究发现不同模型在处理六种错误类型时表现差异巨大,特别是小型模型在空间推理修正上竟然超越了大型模型,颠覆了"越大越好"的认知。
牛津大学研究发现,尽管大语言模型在医学考试中表现出色,但在实际应用中效果大打折扣。研究显示,LLM直接测试时能94.9%准确识别病症,但人类使用LLM诊断时准确率仅34.5%,甚至低于不使用AI的对照组。问题源于用户提供信息不完整、LLM理解偏差等人机交互问题。专家指出,仅凭非交互式基准测试评估LLM存在误导性,需要真实的人机交互测试才能准确评估AI系统的实际性能。
上海交通大学研究团队开发出革命性AI图像检测系统,不仅能以98.1%准确率识别AI生成的假图片,更能像人类专家一样用自然语言详细解释判断依据并标出具体问题区域。该系统通过创新的多模态大语言模型训练方法,实现了从"黑盒判断"到"透明分析"的突破,为新闻、法律等领域提供可信赖的智能辅助工具。