人工智能(AI)已经无处不在,并且在医学领域的应用也越来越广泛。在某些情况下,AI可以增强甚至取代医生的一部分工作。
医学生在选择专业时,应当考虑到AI将如何改变医生的岗位形态(以及获得的薪酬待遇)。再结合专业培训所对应的大量时间投入和跨专业的高门槛,这一点就更显得至关重要。
1760年至1840年之间爆发的工业革命期间,也出现过类似的“替代性”担忧。当时随着1775年詹姆斯·瓦特的蒸汽机和1793年伊莱·惠特尼的轧棉机等机器的发明,人们纷纷惊呼未来的世界将不再需要工人。最终,一部分岗位被因此淘汰,但由于还需要人类来照看和修理设备,更多工作岗位也被创造了出来。
AI掀起的本轮栽倒也可能会走上类似的路线,只是推进速度将会成倍增加。随着AI对于医学实践的颠覆,它很可能比当初工业革命更剧烈的方式改变医生队伍需要满足的技能需求。
下面来看AI最终可能取代的几个医学专业方向。
放射学使用X射线、CT扫描、核磁共振和超声波等成像技术来诊断疾病。而AI算法则特别擅长检测图像模式,并分析各种数字化数据。
在2019年的一项研究中,研究人员尝试将独立AI(完全不涉及放射科医师的干预)与101名放射科医生在2652张乳房X光筛查的结果进行了比较。研究发现,AI的准确率与放射科医生几乎完全一致。AI辅助筛查胸部X光片将检测气胸(肺部外部存有空气)罪状异常的敏锐度提高了26%,检测肺部实变(代表感染)和肺结节(可能是肿瘤的早期征兆)的灵敏度则提高了9%。
短期之内,AI将成为放射科医生们强有力的合作伙伴。但从长远来看,随着这项技术变得越来越独立,医院对于诊断放射科医生的需求可能会逐渐减少。
病理学的核心,在于通过检查组织、细胞和体液并配合各类实验室工具进行诊断。与放射学一样,AI驱动的算法会分析数字化病理切片,从而增强对癌症检测、肿瘤分类和生物标志物的量化能力。
2022年的一项研究表明,AI模型能够显著提高深部粘液样软组织病变的病理学报告诊断准确性,而这是一种传统诊断难度极大的病变。AI模型的准确率高达97%,而人类病理学的准确率仅为70%,一举将误诊率降低了90%。2024年的另一项研究则发现,独立AI模型在解释甲状腺细针穿刺细胞学方面更加准确。与专业细胞病理学家相比,AI模型的准确率高达95%,而专业细胞病理学家的准确率则为89%。
当前,AI能够显著提高病理学家的诊断准确性、速度和一致性。但随着这项技术的持续发展,相当一部分工作可能会完全自动化。
皮肤科涉及对皮疹和皮肤病变的评估,且面对的通常是由全科医生转诊或者直接挂皮肤科号的患者。在大量皮肤图像数据集上训练而成的AI模型,能够帮助识别癌症并诊断各类慢性皮肤疾病。
最近的一项研究发现,AI支持显著提高了皮肤科医生对于黑色素将为和皮肤镜图像分类工作的灵敏度和准确性。诊断灵敏度从60%提高到了75%,准确率则从65%提高到了73%。另一项研究发现,AI助手大大提高了非专科医生诊断皮肤病时的准确性——AI辅助组的准确率为54%,而无辅助组的准确率仅为44%。
随着AI皮肤诊断算法在实践中的应用,这项技术将持续获得改进。一部分技术方案(例如Skin Vision和Mole Mapper)无需人为干预即可诊断皮肤状况,而这项技术应用范围的扩大更是有望降低判断门槛,将疾病诊断和管理的裁量权移交给非专科医生甚至是患者本人。
心脏病专家、内分泌学家、胃肠病学家、风湿病学家以及传染病医生都是能够治疗所在领域复杂疾病的专家。相较于内科或者儿科住院医师,他们的培训往往需要更长的时间和更加艰辛的积累。
未来,AI有望减少咨询这些专家以获取建议及诊疗意见的需求。与之对应,医生自身也可能会越来越依赖AI工具。全科医生(例如初级保健、儿科、急诊医学和在院规培生)有望在AI的指导下轻松诊疗复杂病症,最终扩大自己的执业范围。
此外,AI技术还可能在不涉及手术的各方向上带来更积极的影响,比如外科护理。但必须承认,AI在短期之内还不太可能取代需要独立完成的手术操作。
当然,以上专业领域是否会如我们预想般向着AI转向,目前仍在未定之天。众所周知,医疗保健在创新应用方面的进展相对缓慢,专业群体对于诊疗模式的变革也往往表现出相当强烈的抵触情绪。
尽管如此,考虑到这种潜在未来可能对正在规划长期职业生涯的医学生们的重大影响,大家显然有必要在做出选择之前认真思量。毕竟ChatGPT等各类AI工具,正在以前所未有的速度改变医生群体的执业方式。
好文章,需要你的鼓励
谷歌发布新的AI学术搜索工具Scholar Labs,旨在回答详细研究问题。该工具使用AI识别查询中的主要话题和关系,目前仅对部分登录用户开放。与传统学术搜索不同,Scholar Labs不依赖引用次数或期刊影响因子等传统指标来筛选研究质量,而是通过分析文档全文、发表位置、作者信息及引用频次来排序。科学界对这种忽略传统质量评估方式的新方法持谨慎态度,认为研究者仍需保持对文献质量的最终判断权。
武汉大学研究团队提出DITING网络小说翻译评估框架,首次系统评估大型语言模型在网络小说翻译方面的表现。该研究构建了六维评估体系和AgentEval多智能体评估方法,发现中国训练的模型在文化理解方面具有优势,DeepSeek-V3表现最佳。研究揭示了AI翻译在文化适应和创意表达方面的挑战,为未来发展指明方向。
Meta发布第三代SAM(分割一切模型)系列AI模型,专注于视觉智能而非语言处理。该模型擅长物体检测,能够精确识别图像和视频中的特定对象。SAM 3在海量图像视频数据集上训练,可通过点击或文本描述准确标识目标物体。Meta将其应用于Instagram编辑工具和Facebook市场功能改进。在野生动物保护方面,SAM 3与保护组织合作分析超万台摄像头捕获的动物视频,成功识别百余种物种,为生态研究提供重要技术支持。
参数实验室等机构联合发布的Dr.LLM技术,通过为大型语言模型配备智能路由器,让AI能根据问题复杂度动态选择计算路径。该系统仅用4000个训练样本和极少参数,就实现了准确率提升3.4%同时节省计算资源的突破,在多个任务上表现出色且具有强泛化能力,为AI效率优化开辟新方向。