IQVIA是一家为生命科学行业提供先进分析、技术解决方案和合同研究服务的全球供应商。IQVIA由IMS Health和Quintiles合并而成,致力于帮助企业改善新疗法的临床开发和商业化,加快创新和研究,从而获得更好的医疗保健成果。
挑战
世界各地正在开展大量工作,以降低医疗成本,改善获得医疗服务的机会,并提供新的治疗方法;但进展可能是缓慢的。
IQVIA的高管们正在利用数据和分析来挑战这一现状。
IQVIA全球数据仓库总监Navdeep Alam说:“整个社会花了几十年时间试图改善医疗保健,但你只要打开电视就知道它不起作用。我们开始思考,如果我们采取不同的做法会怎么样,于是开始使用数据驱动的方法重新审视医疗卫生。”
为了创新,IQVIA的工作人员需要更快地探索和迭代数据。然而,由于数据分布在250个不同的数据仓库中,包括Oracle、Netezza和Teradata系统,员工面临着各种各样的障碍。用户需要花费数天时间将数据从孤岛复制到单个系统中进行分析。即便如此,由于性能和可伸缩性的限制,他们通常也无法执行他们想要的分析类型。
“我们的传统方式限制了我们完成更大的事情,”Alam说。“我们专注于两个目标:整合所有数据,并对数据进行分析。”
解决方案
IQVIA在Cloudera上创建了一个现代化的数据平台,使BI员工、数据科学家和统计学家能够建立创造性的新解决方案,帮助降低成本,更快地将新药引入市场,并改善患者的疗效。用户可以进行高性能的、自助式的分析,使用更大的数据集开发预测算法,并利用匿名的患者洞察来获得更深入、更准确的见解。
“我们有70个不同的团队,大约1500到2000人,利用这个平台用数据做一些非常独特的事情,从确定下一代临床发展战略到构建新的算法来推进阿尔茨海默病的研究,”Alam说。
该平台汇集了来自公司全球250个数据仓库的超过2PB 的数据,员工可以整合新的数据类型,比如社交媒体数据。
此外,IQVIA可以让分析更接近数据,从而获得更快的查询性能。用户已经使用他们熟悉的BI工具在该平台上进行了近百万次查询。数据科学家可以在Cloudera Data Science Workbench中使用R、Python或Scala来协作和加速新的机器学习算法的开发。
实现
由于IQVIA的工作人员通常必须从相同的数据中获取数据,该公司试图创建一个全球多租户数据湖,使用共享的数据体验进行加密、治理和基于角色的访问。
“在Cloudera技术的帮助下,我们建立了四个数据租户 — 一个美国的数据湖,一个西班牙的数据湖,一个法国的数据湖和一个日本的数据湖,”Alam说。“在一个系统中完成所有这些工作,并在全球和集中地进行管理,为我们创造了巨大的效率。”
IQVIA计划最终创建一个混合的云环境,让它可以安全地直接向客户提供分析服务。“Cloudera 产品将帮助我们在公共云中建立姐妹租户,在必要时为我们和客户的数据提供一个交汇场所,”Alam说。
成果
“我坚信我们正处在改变数十亿人生活的转折点。
- IQVIA全球数据仓库总监Navdeep Alam
如今,IQVIA可以在几秒钟内,而不是几天、几周或几个月的时间内,从数据中为客户生成洞见。这一巨大提升使生命科学公司能够更快地创新和拯救生命。
想一想对新药开发生命周期的影响。
Alam说:“以前,如果一家制药公司因为没有足够的预算来进行两种药物的研究,而需要从这两种药物中选择一种进行研究,那么根据问题的复杂性,可能需要几天、几周甚至几个月的时间来评估潜在的市场需求。现在,我们可以在几秒钟内说,100万人可以从一种药物中受益,而只有1万人可以从另一种药物中受益。”
一旦药物开发开始,IQVIA分析可以帮助公司在几秒钟或几分钟内,而不是几周或几个月,确定临床试验的合格患者。它还提高了预测患者是否有资格在出现症状前进行临床试验的能力,以帮助患者更快获得临床试验的机会。
Alam说:“通过更快地找到合适的人,公司可以降低药物成本和上市时间,从而更快、更便宜地将救命药推向市场。”
好文章,需要你的鼓励
很多人担心被AI取代,陷入无意义感。按照杨元庆的思路,其实无论是模型的打造者,还是模型的使用者,都不该把AI放在人的对立面。
MIT研究团队提出递归语言模型(RLM),通过将长文本存储在外部编程环境中,让AI能够编写代码来探索和分解文本,并递归调用自身处理子任务。该方法成功处理了比传统模型大两个数量级的文本长度,在多项长文本任务上显著优于现有方法,同时保持了相当的成本效率,为AI处理超长文本提供了全新解决方案。
谷歌宣布对Gmail进行重大升级,全面集成Gemini AI功能,将其转变为"个人主动式收件箱助手"。新功能包括AI收件箱视图,可按优先级自动分组邮件;"帮我快速了解"功能提供邮件活动摘要;扩展"帮我写邮件"工具至所有用户;支持复杂问题查询如"我的航班何时降落"。部分功能免费提供,高级功能需付费订阅。谷歌强调用户数据安全,邮件内容不会用于训练公共AI模型。
华为研究团队推出SWE-Lego框架,通过混合数据集、改进监督学习和测试时扩展三大创新,让8B参数AI模型在代码自动修复任务上击败32B对手。该系统在SWE-bench Verified测试中达到42.2%成功率,加上扩展技术后提升至49.6%,证明了精巧方法设计胜过简单规模扩展的技术理念。