AWS近日表示,通过推出一项名为Amazon Omics的全新专用服务加大对遗传学研究的投入。
AWS在本周举行的AWS re:Invent上表示,Amazon Omics旨在帮助医疗保健提供商和生命科学组织存储、查询、分析基因组和转录组数据,以及其他类型的组数据,然后生成有助于改善健康和推进科学发现的洞察。
AWS首席开发布道师Channy Yun在博客文章中解释说,医疗保健和生命科学公司通常会收集各种生物数据,目的是利用这些信息来改善患者护理并推进科学研究,这种研究被业内人士称为“组学”研究。
Yun解释说:“这些组织会绘制出个体对疾病的遗传易感性,根据蛋白质结构和功能确定新的药物靶点,根据特定细胞中表达的基因分析肿瘤,或者研究肠道细菌会给人类健康带来怎样的影响。”
组学的全部意义在于,通过收集数千人的基因数据,并对其进行比较和分析,研究人员可以产生新的洞察来预测疾病、各种不同药物和治疗的疗效。因此,组学对于推进医学研究和药物发现是至关重要的。
组学研究的一个大问题是,必须是大规模进行的,这可能会给那些没有能力处理这些数据的医疗保健公司和生命科学组织带来问题。
AWS首席医疗官兼技术健康AI副总裁Taha Kass-Hout在接受采访时表示:“这类数据非常复杂,围绕细胞生物学的数据呈现爆炸式增长,这超出了人类自身的理解能力。”
组学研究涉及到处理PB级的数据,因此研究人员需要一种经济高效的方式来存储这些信息,以及简单的方式访问这些信息。Yun说:“你需要在保持准确性和可靠性的同时,扩展数百万生物样本的计算,还需要专门的工具来分析人群中的遗传模式,并训练机器学习模型来预测各种疾病。”
AWS认为这就是Amazon Omics的用武之地。Amazon Omics可以支持对组学数据的大规模分析和协作研究。Amazon Omics不仅提供了此类信息的一种有效存储方式,而且让研究人员可以轻松利用其他AWS服务来分析整个人群的基因组数据,还可以自动配置和扩展生物信息学工作流程,使研究人员能够大规模运行分析管道。
Amazon Omics服务主要面向生物信息学家、研究人员和科学家,由三个主要部分组成:用于组学优化的对象存储,以更低成本高效地存储和共享数据;用于生物信息学工作流程的托管计算,使执行数据分析变得简单;用于优化的数据存储,可以对人口规模进行变异分析。
Amazon Omics实际上就是支持性分析,为此它兼容Amazon SageMaker等服务,后者可针对非常特定的目的训练机器学习模型。例如,用户可以训练机器学习模型来分析组学数据,并预测某些人是否易患某些类型的疾病,还可以将个人的基因组数据与其在Amazon HealthLake中的病史结合起来。
Amazon Omics现在已经在AWS位于美国东部(弗吉尼亚北部)、美国西部(俄勒冈)、亚太地区(新加坡)、欧洲(法兰克福)、欧洲(爱尔兰)和欧洲(伦敦)的区域上线。
好文章,需要你的鼓励
英特尔携手戴尔以及零克云,通过打造“工作站-AI PC-云端”的协同生态,大幅缩短AI部署流程,助力企业快速实现从想法验证到规模化落地。
意大利ISTI研究院推出Patch-ioner零样本图像描述框架,突破传统局限实现任意区域精确描述。系统将图像拆分为小块,通过智能组合生成从单块到整图的统一描述,无需区域标注数据。创新引入轨迹描述任务,用户可用鼠标画线获得对应区域描述。在四大评测任务中全面超越现有方法,为人机交互开辟新模式。
阿联酋阿布扎比人工智能大学发布全新PAN世界模型,超越传统大语言模型局限。该模型具备通用性、交互性和长期一致性,能深度理解几何和物理规律,通过"物理推理"学习真实世界材料行为。PAN采用生成潜在预测架构,可模拟数千个因果一致步骤,支持分支操作模拟多种可能未来。预计12月初公开发布,有望为机器人、自动驾驶等领域提供低成本合成数据生成。
MIT研究团队发现,AI系统无需严格配对的多模态数据也能显著提升性能。他们开发的UML框架通过参数共享让AI从图像、文本、音频等不同类型数据中学习,即使这些数据间没有直接对应关系。实验显示这种方法在图像分类、音频识别等任务上都超越了单模态系统,并能自发发展出跨模态理解能力,为未来AI应用开辟了新路径。