IQVIA是一家为生命科学行业提供先进分析、技术解决方案和合同研究服务的全球供应商。IQVIA由IMS Health和Quintiles合并而成,致力于帮助企业改善新疗法的临床开发和商业化,加快创新和研究,从而获得更好的医疗保健成果。
挑战
世界各地正在开展大量工作,以降低医疗成本,改善获得医疗服务的机会,并提供新的治疗方法;但进展可能是缓慢的。
IQVIA的高管们正在利用数据和分析来挑战这一现状。
IQVIA全球数据仓库总监Navdeep Alam说:“整个社会花了几十年时间试图改善医疗保健,但你只要打开电视就知道它不起作用。我们开始思考,如果我们采取不同的做法会怎么样,于是开始使用数据驱动的方法重新审视医疗卫生。”
为了创新,IQVIA的工作人员需要更快地探索和迭代数据。然而,由于数据分布在250个不同的数据仓库中,包括Oracle、Netezza和Teradata系统,员工面临着各种各样的障碍。用户需要花费数天时间将数据从孤岛复制到单个系统中进行分析。即便如此,由于性能和可伸缩性的限制,他们通常也无法执行他们想要的分析类型。
“我们的传统方式限制了我们完成更大的事情,”Alam说。“我们专注于两个目标:整合所有数据,并对数据进行分析。”
解决方案
IQVIA在Cloudera上创建了一个现代化的数据平台,使BI员工、数据科学家和统计学家能够建立创造性的新解决方案,帮助降低成本,更快地将新药引入市场,并改善患者的疗效。用户可以进行高性能的、自助式的分析,使用更大的数据集开发预测算法,并利用匿名的患者洞察来获得更深入、更准确的见解。
“我们有70个不同的团队,大约1500到2000人,利用这个平台用数据做一些非常独特的事情,从确定下一代临床发展战略到构建新的算法来推进阿尔茨海默病的研究,”Alam说。
该平台汇集了来自公司全球250个数据仓库的超过2PB 的数据,员工可以整合新的数据类型,比如社交媒体数据。
此外,IQVIA可以让分析更接近数据,从而获得更快的查询性能。用户已经使用他们熟悉的BI工具在该平台上进行了近百万次查询。数据科学家可以在Cloudera Data Science Workbench中使用R、Python或Scala来协作和加速新的机器学习算法的开发。
实现
由于IQVIA的工作人员通常必须从相同的数据中获取数据,该公司试图创建一个全球多租户数据湖,使用共享的数据体验进行加密、治理和基于角色的访问。
“在Cloudera技术的帮助下,我们建立了四个数据租户 — 一个美国的数据湖,一个西班牙的数据湖,一个法国的数据湖和一个日本的数据湖,”Alam说。“在一个系统中完成所有这些工作,并在全球和集中地进行管理,为我们创造了巨大的效率。”
IQVIA计划最终创建一个混合的云环境,让它可以安全地直接向客户提供分析服务。“Cloudera 产品将帮助我们在公共云中建立姐妹租户,在必要时为我们和客户的数据提供一个交汇场所,”Alam说。
成果
“我坚信我们正处在改变数十亿人生活的转折点。
- IQVIA全球数据仓库总监Navdeep Alam
如今,IQVIA可以在几秒钟内,而不是几天、几周或几个月的时间内,从数据中为客户生成洞见。这一巨大提升使生命科学公司能够更快地创新和拯救生命。
想一想对新药开发生命周期的影响。
Alam说:“以前,如果一家制药公司因为没有足够的预算来进行两种药物的研究,而需要从这两种药物中选择一种进行研究,那么根据问题的复杂性,可能需要几天、几周甚至几个月的时间来评估潜在的市场需求。现在,我们可以在几秒钟内说,100万人可以从一种药物中受益,而只有1万人可以从另一种药物中受益。”
一旦药物开发开始,IQVIA分析可以帮助公司在几秒钟或几分钟内,而不是几周或几个月,确定临床试验的合格患者。它还提高了预测患者是否有资格在出现症状前进行临床试验的能力,以帮助患者更快获得临床试验的机会。
Alam说:“通过更快地找到合适的人,公司可以降低药物成本和上市时间,从而更快、更便宜地将救命药推向市场。”
好文章,需要你的鼓励
CPU架构讨论常聚焦于不同指令集的竞争,但实际上在单一系统中使用多种CPU架构已成常态。x86、Arm和RISC-V各有优劣,AI技术的兴起更推动了对性能功耗比的极致需求。当前x86仍主导PC和服务器市场,Arm凭借庞大生态系统在移动和嵌入式领域领先,RISC-V作为开源架构展现巨大潜力。未来芯片设计将更多采用异构计算,多种架构协同工作成为趋势。
延世大学研究团队通过分析AI推理过程中的信息密度模式,发现成功的AI推理遵循特定规律:局部信息分布平稳但全局可以不均匀。这一发现颠覆了传统的均匀信息密度假说在AI领域的应用,为构建更可靠的AI推理系统提供了新思路,在数学竞赛等高难度任务中显著提升了AI的推理准确率。
Vast Data与云计算公司CoreWeave签署了价值11.7亿美元的多年期软件许可协议,这标志着AI基础设施存储市场的重要转折点。该协议涵盖Vast Data的通用存储层及高级数据平台服务,将帮助CoreWeave提供更全面的AI服务。业内专家认为,随着AI集群规模不断扩大,存储系统在AI基础设施中的占比可能从目前的1.9%提升至3-5%,未来五年全球AI存储市场规模将达到900亿至2000亿美元。
蒙特利尔大学团队发现让AI"分段思考"的革命性方法Delethink,通过模仿人类推理模式将长篇思考分解为固定长度块,仅保留关键信息摘要。1.5B小模型击败传统大模型,训练成本降至四分之一,计算复杂度从平方级降为线性级,能处理十万词汇超长推理,为高效AI推理开辟新道路。