ZD至顶网软件频道消息: 癌症是全世界共同面临的公共健康问题。美国药物研究与制造商协会最新报告显示,在目前正在研究的800种治疗癌症的药物中,73%有潜力成为“个性化药物”。个性化治疗,又叫“精准医疗”,是一种以基因数据为基础的新兴治疗手段,未来可能会让癌症这样的“大病”转化为像高血压一样的慢性病。
从去年开始,我国迎来了精准医疗多项国家政策的发布。不过,伴随人口老龄化,癌症的防治之路依然任重道远。在这一点上,科技公司通过ABC技术手段(人工智能AI、大数据Big Data和云计算Cloud Computing)来优化精准医疗的数据处理流程、提高数据化程度,正在引发越来越多的关注。
前有政策催化后有资本推动,精准医疗难的根本在于“数据化”
2016年是全球精准医疗“多重奏”的一年。美国“癌症登月”加码,英国十万基因组计划加速推进。3月份,中国也正式发布了精准医疗的国家指南,精准医疗(基因组学)入选了“十三五”100个重大项目。
相关国家政策的提出为精准医学的技术开发、应用实践和商业规划指出了可循的路径,迎来了资本市场的看好。2016年中国精准医疗产业规模达400亿元,并且在未来将保持20%以上的年均增长率。基因测序作为精准医疗产业基础占据了最大份额,达到63.7%。
看似顺利的产业发展形势下,精准医疗事业的难点究竟在哪里?
所谓精准医疗,卫生部原副部长何界生的说法最为通俗易懂。她认为精准医疗如同“量体裁衣”,制定个性化的治疗方案。个体基因不同、环境与生活习惯差异,都关系着疾病防治。
理想状态下,基于基因数据分析的精准医疗能够提供一个较为全面的健康管理方案,从预测到治疗,都能较精准地对患者病情进行较为准确地把握。不过,正是这种“精准”对基因数据提出了高要求。
除却有些人不愿意透露关乎个人健康的隐私因素外,我国还面临着人口庞大、社会环境复杂的现状,基因数据的收集、分析和匹配是一项名副其实的“技术活”。在这一点上,具备人工智能、大数据和云计算技术优势的公司拥有“用武之地”。
百度云联合多家医疗企业,要让基因数据分析更“智能”
对基因数据的研究,是疾病防治需要面对的第一道关卡。在这个过程中,科技公司的优势基本可以体现为三方面:数据库的搭建,基因数据处理,基因数据的智能化解读。
数据库的搭建可以理解为医疗数据的云化。基因研究的数据一直是以指数级增长,但“数据多却不能用”是传统基因研究的问题所在。数据分析领域有一个说法“垃圾放进去,出来的也还是垃圾”,讲的正是数据的收集和标准化问题。尤其是像癌症这样的“大病”,其防治是全球面临的共同课题。如果各国、各机构提交的大数据都是零散、碎片的,那么即便拥有海量数据也很难挖掘它的价值。
云计算给基因数据带来的新思路是通过海量可弹性调度的计算与存储资源,帮助测序中心、科研与临床用户以及SaaS服务提供商便捷地在云端部署基因数据分析乃至整个精准医疗与健康管理数据分析的全流程,从而推动精准医疗知识库的开发和应用,让医学数据分析成为全球协作的事业。
百度云为知名基因研发机构华大基因部署了BGI BRCA Online平台,通过先进的计算能力为乳腺癌、卵巢癌的科研与应用提供基因测序数据分析服务。百度云还为博奥晶典部署了“晶典云”系统,为遗传病、罕见病的科研以及临床诊断提供更快捷、精准的基因测序数据分析服务,加快全球精准医学的发展。
当前,人工智能、机器学习等技术已经进入应用化阶段。今年两会的政府工作报告首次提出“加快人工智能等技术的研发和转化”,对于人工智能新产业表示重视。那么在基因数据智能化处理方面,AI究竟能够被应用到怎样的程度?
在与青梧桐健康基因等多家精准医疗企业的合作中,百度云将为其设计相应的机器学习算法,探索食道癌、糖尿病等多种疾病的基因突变意义,以期实现基因数据解读的智能化进程。
据悉,百度云目前正在积极引领人工智能、大数据和云计算技术在医疗行业的落地。在疾病防治这项关乎生命质量的事业上,科技企业所能发挥的作用还有更多。正如百度创始人李彦宏所说,在基因数据分析、制药研发、智能诊疗等方面,人工智能可以参与其中。
好文章,需要你的鼓励
这项研究由浙江大学、复旦大学等机构联合完成,提出了ReVisual-R1模型,通过创新的三阶段训练方法显著提升了多模态大语言模型的推理能力。研究发现优化的纯文本冷启动训练、解决强化学习中的梯度停滞问题、以及分阶段训练策略是关键因素。ReVisual-R1在各类推理基准测试中超越了现有开源模型,甚至在某些任务上超过了商业模型,为多模态推理研究开辟了新途径。
这项研究提出了一种名为"批评式微调"的创新方法,证明仅使用一个问题的批评数据就能显著提升大语言模型的推理能力。研究团队对Qwen和Llama系列模型进行实验,发现这种方法在数学和逻辑推理任务上都取得了显著提升,平均提高15-16个百分点,而且只需要强化学习方法1/20的计算资源。这种简单高效的方法为释放预训练模型的潜在推理能力提供了新途径。
新加坡国立大学研究团队开发了名为IEAP的图像编辑框架,它通过将复杂编辑指令分解为简单原子操作序列解决了当前AI图像编辑的核心难题。研究发现当前模型在处理不改变图像布局的简单编辑时表现出色,但在需要改变图像结构时效果差。IEAP框架定义了五种基本操作,并利用思维链推理技术智能分解用户指令,实验证明其性能显著超越现有方法,尤其在处理复杂多步骤编辑时。
Character AI的研究者开发出TalkingMachines系统,通过自回归扩散模型实现实时音频驱动视频生成。研究将预训练视频模型转变为能进行FaceTime风格对话的虚拟形象系统。核心创新包括:将18B参数的图像到视频DiT模型改造为音频驱动系统、通过蒸馏实现无错误累积的无限长视频生成、优化工程设计降低延迟。系统可让多种风格的虚拟角色与人进行自然对话,嘴型与语音同步,为实时数字人交互技术开辟了新可能。