当新冠疫情肆虐、人们心理健康出现危机、医疗成本上升、人口老龄化各种趋势交织出现的时候,行业领导者们加快了开发医疗专用AI应用的步伐,其中一个来自风投市场的信号显示:超过40家初创公司筹集了大量资金(超过2000万美金)用于打造医疗AI解决方案,但是到底AI是如何用于医疗行业中的呢?
最近一份题为《2022年医疗AI调查》的报告,对全球300多名受访者进行了调查,以了解和定义医疗AI带来的挑战、取得的成就以及使用场景。这是该调查启动后的第二年,虽然从结果来看没有显着的变化,但确实出现了一些有趣的趋势,预示着未来几年可能会发生怎样的变化。虽然这种演变的某些方面是积极的(例如人工智能的普及),但还有一些方面却不那么令人感到兴奋(例如攻击面加大),下面就让我们来看看下面这三个企业需要了解的趋势。
1、使用无代码工具实现AI的易用和普及
根据Gartner估计,到2025年,企业开发的新应用中有70%将使用无代码或者低代码技术,这一数据高于2020年的不到25%。低代码能够简化程序员的工作量,而无需数据科学干预的无代码解决方案将给企业及其他领域带来的影响最大,这也说明了为什么人工智能技术的使用范围从技术专业人员转移到领域专家是令人感到兴奋的。
这对医疗行业来说,意味着将有超过半数(61%)的受访者把临床医生作为他们的目标用户,其次是医疗服务支付方(45%)和医疗IT企业(38%),再加上医疗AI应用的快速发展、获得大量投资、开源技术的普及可用性,说明了医疗AI正在被更广泛地采用。
这一点很重要:把代码交到医护人员手中,就像使用Excel或Photoshop等常用办公工具一样便捷,将给AI带来改变,使其变得更好。医疗AI除了更易于使用之外,还可以实现更准确、更可靠的结果,因为现在医疗AI是由医疗专业人员(而不是软件专业人员)使用和掌管的。当然,这些变化不会在一夜之间发生,但对AI来说,被领域专家越来越多地使用,就是向前迈出了重大一步。
2、工具越来越复杂,文本越来越实用
此次调查还有其他一些令人鼓舞的发现,例如AI工具不断发展进步,以及用户希望对特定模型进行深入的研究。当受访者被问及他们计划在2022年底之前采用哪些技术时,有很多技术负责人提到了数据集成(46%)、商业智能(44%)、自然语言处理(43%)和数据注释(38%)。目前文本是AI应用最有可能使用的数据类型,同时,受访者对自然语言处理(NLP)和数据注释的重视,表明更复杂的AI技术正在兴起。
这些工具为很多重要的使用场景提供支持,例如支持临床决策、药物发现和医疗策略评估等等。特别是经过了这两年新冠疫情大流行之后,我们开发了新的疫苗,知道了如何在发生大规模事件之后更好地支持医疗系统的需求,因此在这些技术领域取得进展就显得如此重要。通过这些例子,我们很明确地了解到,AI在医疗行业的用途与其他行业有很大的不同,因此也需要一种不同的方法。
因此,成熟组织的技术领导者和受访者,都把医疗特定模型和算法的可用性作为评估是在本地安装软件库还是采用SaaS解决方案的一个最重要要求,也就不足为怪了。从风投格局、市场现有软件库、人工智能用户的需求等多个方面来看,未来几年内医疗特定只会不断增长。
3、安全问题日益突显
过去一年中AI取得了诸多进展,同时也引入了一系列新的攻击媒介。当受访者被问及使用哪些类型的软件来开发AI应用,最受欢迎的选择是本地安装的商业软件(37%)和开源软件(35%)。最值得注意的是,与去年的调查结果相比,云服务的使用率减少了12%(30%),很可能原因就是数据共享导致的隐私问题。
此外,大多数受访者(53%)选择依靠自己的数据来验证模型,而不是使用第三方或者软件厂商的指标。来自成熟组织的受访者(68%)表示,他们倾向于使用内部评估和自行调整的模式。而且,因为关于医疗数据处理有着严格的控制和各种程序,这也说明了为什么AI用户希望尽可能在组织内部处理这些问题。
但无论对软件有哪些偏好或者用户如何验证模型,不断升级的医疗安全威胁都可能产生重大影响。虽然其他关键基础设施服务同样面临各种挑战,但医疗违规的后果已经不仅仅是声誉和财务上的损失了,数据丢失或者医院设备被攻击,关乎的是生与死的问题。
随着开发者和投资者努力让AI技术掌握于日常用户的手中,AI将有望实现更显着的增长。但随着AI被更广泛地采用,模型和工具的持续改进,安全和道德将成为一个需要关注的重点领域。今年医疗行业的AI技术将如何发展,对行业未来意味着什么,这些都值得我们期待。
好文章,需要你的鼓励
OpenAI首席执行官Sam Altman表示,鉴于投资者的AI炒作和大量资本支出,我们目前正处于AI泡沫中。他承认投资者对AI过度兴奋,但仍认为AI是长期以来最重要的技术。ChatGPT目前拥有7亿周活跃用户,是全球第五大网站。由于服务器容量不足,OpenAI无法发布已开发的更好模型,计划在不久的将来投资万亿美元建设数据中心。
阿里巴巴团队提出FantasyTalking2,通过创新的多专家协作框架TLPO解决音频驱动人像动画中动作自然度、唇同步和视觉质量的优化冲突问题。该方法构建智能评委Talking-Critic和41万样本数据集,训练三个专业模块分别优化不同维度,再通过时间步-层级自适应融合实现协调。实验显示全面超越现有技术,用户评价提升超12%。
英伟达推出新的小型语言模型Nemotron-Nano-9B-v2,拥有90亿参数,在同类基准测试中表现最佳。该模型采用Mamba-Transformer混合架构,支持多语言处理和代码生成,可在单个A10 GPU上运行。独特的可切换推理功能允许用户通过控制令牌开启或关闭AI推理过程,并可管理推理预算以平衡准确性和延迟。模型基于合成数据集训练,采用企业友好的开源许可协议,支持商业化使用。
UC Berkeley团队提出XQUANT技术,通过存储输入激活X而非传统KV缓存来突破AI推理的内存瓶颈。该方法能将内存使用量减少至1/7.7,升级版XQUANT-CL更可实现12.5倍节省,同时几乎不影响模型性能。研究针对现代AI模型特点进行优化,为在有限硬件资源下运行更强大AI模型提供了新思路。