AWS近日表示,通过推出一项名为Amazon Omics的全新专用服务加大对遗传学研究的投入。
AWS在本周举行的AWS re:Invent上表示,Amazon Omics旨在帮助医疗保健提供商和生命科学组织存储、查询、分析基因组和转录组数据,以及其他类型的组数据,然后生成有助于改善健康和推进科学发现的洞察。
AWS首席开发布道师Channy Yun在博客文章中解释说,医疗保健和生命科学公司通常会收集各种生物数据,目的是利用这些信息来改善患者护理并推进科学研究,这种研究被业内人士称为“组学”研究。
Yun解释说:“这些组织会绘制出个体对疾病的遗传易感性,根据蛋白质结构和功能确定新的药物靶点,根据特定细胞中表达的基因分析肿瘤,或者研究肠道细菌会给人类健康带来怎样的影响。”
组学的全部意义在于,通过收集数千人的基因数据,并对其进行比较和分析,研究人员可以产生新的洞察来预测疾病、各种不同药物和治疗的疗效。因此,组学对于推进医学研究和药物发现是至关重要的。
组学研究的一个大问题是,必须是大规模进行的,这可能会给那些没有能力处理这些数据的医疗保健公司和生命科学组织带来问题。
AWS首席医疗官兼技术健康AI副总裁Taha Kass-Hout在接受采访时表示:“这类数据非常复杂,围绕细胞生物学的数据呈现爆炸式增长,这超出了人类自身的理解能力。”
组学研究涉及到处理PB级的数据,因此研究人员需要一种经济高效的方式来存储这些信息,以及简单的方式访问这些信息。Yun说:“你需要在保持准确性和可靠性的同时,扩展数百万生物样本的计算,还需要专门的工具来分析人群中的遗传模式,并训练机器学习模型来预测各种疾病。”
AWS认为这就是Amazon Omics的用武之地。Amazon Omics可以支持对组学数据的大规模分析和协作研究。Amazon Omics不仅提供了此类信息的一种有效存储方式,而且让研究人员可以轻松利用其他AWS服务来分析整个人群的基因组数据,还可以自动配置和扩展生物信息学工作流程,使研究人员能够大规模运行分析管道。
Amazon Omics服务主要面向生物信息学家、研究人员和科学家,由三个主要部分组成:用于组学优化的对象存储,以更低成本高效地存储和共享数据;用于生物信息学工作流程的托管计算,使执行数据分析变得简单;用于优化的数据存储,可以对人口规模进行变异分析。
Amazon Omics实际上就是支持性分析,为此它兼容Amazon SageMaker等服务,后者可针对非常特定的目的训练机器学习模型。例如,用户可以训练机器学习模型来分析组学数据,并预测某些人是否易患某些类型的疾病,还可以将个人的基因组数据与其在Amazon HealthLake中的病史结合起来。
Amazon Omics现在已经在AWS位于美国东部(弗吉尼亚北部)、美国西部(俄勒冈)、亚太地区(新加坡)、欧洲(法兰克福)、欧洲(爱尔兰)和欧洲(伦敦)的区域上线。
好文章,需要你的鼓励
AWS通过升级SageMaker机器学习平台来扩展市场地位,新增观测能力、连接式编码环境和GPU集群性能管理功能。面对谷歌和微软的激烈竞争,AWS专注于为企业提供AI基础设施支撑。SageMaker新功能包括深入洞察模型性能下降原因、为开发者提供更多计算资源控制权,以及支持本地IDE连接部署。这些更新主要源于客户需求,旨在解决AI模型开发中的实际问题。
南洋理工大学研究团队开发了WorldMem框架,首次让AI拥有真正的长期记忆能力,解决了虚拟世界模拟中的一致性问题。该系统通过记忆银行存储历史场景,并使用智能检索机制,让AI能准确重现之前的场景和事件,即使间隔很长时间。实验显示在Minecraft和真实场景中都表现出色,为游戏、自动驾驶、机器人等领域带来广阔应用前景。
AI虽具备变革企业洞察力的潜力,但成功依赖于数据质量。大多数AI项目失败源于数据混乱分散而非算法局限。谷歌BigQuery云数据AI平台打破数据孤岛,简化治理,加速企业AI应用。通过AI自动化数据处理,实现实时分析,并与Vertex AI深度集成,使企业能够高效处理结构化和非结构化数据,将智能商业转型从愿景变为现实。
MTS AI研究团队提出RewardRanker系统,通过重排序模型和迭代自训练显著提升AI代码生成质量。该方法让13.4B参数模型超越33B大模型,在多种编程语言上表现优异,甚至在C++上超越GPT-4。通过引入困难负样本和PPO优化,系统能从多个代码候选中选出最优方案,为AI编程助手的实用化奠定基础。