RES允许用户从MERRA数据中查询再分析数据集

美国国家航空航天局气候模拟中心开发出了一种再分析全效服务,允许研究人员利用已有算力通过基于web的接口来分析位于NCCS的大型数据集,而不再需要下载数据。

MERRA分析界面

再分析全效服务(RES)允许用户从MERRA数据中查询再分析数据集。RES的创建是为了应对气候科学的大数据挑战。随着地球数据的可用性和数量增加,研究人员不得不耗费更多时间来下载和处理他们的数据,而不是进行科学研究。美国国家航空航天局气候模拟中心(NCCS)已经开发出了一种再分析全效服务这一高性能的大数据分析框架,允许研究人员利用已有算力通过基于web的接口来分析位于NCCS的大型数据集,从而不再需要下载数据。

RES便于进行一系列的“规范操作”— min、max、sum、difference、average、root mean square、anomaly和standard deviation — 研究人员可以将这些操作组合起来开发各种工作流。RES可在有限的内存空间内,在交互和批量响应时间内高效处理巨大的数据集。这些操作和数据集可以通过用户编写的应用程序借助RES来访问。

RES接口支持对消费者应用程序的web服务访问,支持交互式请求的图形用户界面,便于熟悉基本RES命令的用户使用命令行界面,支持精通python的用户进行高级编程访问。RES允许用户在不下载输入数据集的情况下接近数据进行计算。

架构组件

RES架构包括三个组件:

  1. 客户端运行软件,可以是Jupyter Notebook,也可以是Python脚本,通过Python安装在用户系统上。
  2. Apache HTTP web服务器,它侦听外部请求,解析请求并将它们提交到分析服务器。
  3. 后端分析代码。利用Cloudera将工作分区到可用的工作节点。

用户调用客户端访问Apache HTTP web服务器,后者将请求转发给后端服务器。结果以NetCDF文件的形式返回给用户系统。

来源:至顶网软件与服务频道

0赞

好文章,需要你的鼓励

2022

03/10

17:41

分享

点赞