Cloudera发布全新数据平台CDP,强化企业数据云公司定位

作者:邹大斌   【原创】   2020-07-01 14:48:39

关键字: 大数据 Hadoop

Cloudera日前发布了最新一代产品Cloudera Data Platform(CDP),该平台产品可在混合和多云环境中提供强大的自助式服务分析,实现从边缘到人工智能的价值交付。

至顶网软件与服务频道消息: Cloudera日前发布了最新一代产品Cloudera Data Platform(CDP),该平台产品可在混合和多云环境中提供强大的自助式服务分析,实现从边缘到人工智能的价值交付。这是Cloudera与Hortonworks合并之后的重大产品升级,集合了Cloudera的旗舰产品CDH和Hortonworks旗舰产品HDP之精华,集成了Apache开源社区的30多个开源项目,经过充分测试、整合而成。Cloudera与Hortonworks合并后的新定位是企业数据云公司,这一产品的推出将进一步强化Cloudera企业数据云公司的新定位。

全新数据云平台CDP

今天,云已经成为越来越多企业的主流IT环境,将数据相关处理架构在云上势在必行,CDP的推出也是顺应了这一趋势。CDP分为两个版本:公有云版本和Private Cloud(CDP私有云),两个版本完全同构。其中,CDP公有云版本是一个PaaS服务,以公有云服务的形式提供,目前已经可以在AWS、Azure上面获取。CDP私有云专为混合云构建,,以统一的内置安全治理能力将本地部署环境无缝连接至公有云。

Cloudera大中华区总经理徐晋介绍,CDP可以提供六大能力。首先是提供数据中心 (Data Hub) 的能力,也就是提供一个基础性的集中存放数据、管理数据的能力。第二个是Data Flow & Streaming,包括用于数据收集和流式的实时数据处理的一整套产品。第三个是Cloudera Data Engineering,主要是用来进行批量数据处理。第四个是Cloudera Data Warehouse,也就是数据仓库,可以替换原有的传统数据仓库。第五个是Operational Database,基于Hbase等一些实时的非结构化的数据库,提供互联网级别的对外服务。第六个是机器学习的平台。

除了上述六大核心能力之外,CDP还提供了一个非常独特的数据管理的平台,Cloudera称之为SDX,即共享数据体验。

“其含义是:所有存放在CDP平台上的数据,无论用户是想把这些数据用做批量处理还是做报表,还是做机器学习,CDP都会提供统一的数据管理、统一的数据目录、统一数据的安全管控,也就是会有同一套的数据治理机制。”徐晋解释说。

此外,容器化的安装部署也是CDP的一大特点。CDP私有云版本以红帽OpenShift为支撑,以Kubernetes支持的强大混合架构完善了企业数据云愿景,该架构将计算和存储分离,提高了敏捷性、易用性以及私有云和公有云基础架构的使用效率。

“Cloudera把自己的数据持久化能力集成在产品中,允许把工作负载从物理架构中抽离出来,让工作负载在容器化的计算平台上面灵活地部署和使用。而且,CDP还可以和其他非Cloudera应用共享基础架构,这样客户不必重复投资。” Cloudera大中华区技术总监刘隶放介绍。

赋能客户5大能力

近几年,随着数据的爆炸性增长,构建大数据平台成为不少企业的选择,而市场上也出现了不少类似的大数据平台,不少企业甚至还往前再进一步,开始构建数据中台。作为新一代的大数据平台,CDP具有自己的独特优势。

对此徐晋表示,相对市场上其他类似的平台。CDP一大优势是其作为Hadoop的代表,成为很多用户的默认选择。作为大数据的代表,围绕Hadoop形成了非常完善的产业生态,组件成熟和完善,这是其他平台很难有的。其次是CDP的完整性。CDP并不是一个单一功能的产品,而是一个覆盖数据整个生命周期的平台产品,提供了全套的数据安全和数据治理这方面的功能。第三是CDP平台的开放性,CDP全部开源。

“Cloudera后续产品所有源代码都会100%开源,我们会继续在社区做开源项目的贡献。” 徐晋说。

徐晋表示,如今Cloudera的定位是企业数据云公司,CDP是为支撑这个定位迈出的重要一步。Cloudera最终希望从以下五个方面来帮助客户:

1.数据安全。不管企业在哪里运行其数据都能够确保一致的数据安全性,能实现对数据进行有效的治理。

2. 影子IT的管理。影子IT指的是IT部门掌控之外的IT系统,大多数是由业务部门自己主导采购。因为不同IT系统往往会带入不同的数据平台,这非常不利于企业实现统一的数据战略。

3. 跨公有云、私有云的云原生服务。无论用户是在自己的私有云还是裸金属服务器、还是在不同的公有云上都能有一致的体验。

4. 支持完整的数据生命周期。提供的不是某个单点的解决方案,而是一个端到端的从边缘计算到中心,经过粗加工、精加工,到能够提供前瞻性预测,数据全生命周期的管理所需要的全部功能的平台。

5.建立AI工厂。能够赋能客户以标准的方式来做数据驱动的决策,进一步提升他们的能力。

“这些是Cloudera在应对我们目前的大环境满足客户提出的新的需求时我们希望产品发展的五个方向,为此Cloduera将持续完善和推出自己的产品和服务。” 徐晋说。
 

    扫一扫

    分享文章到微信


    北京第二十六维信息技术有限公司(至顶网)版权所有. 京ICP备15039648号-7 京ICP证161336号京公网安备 11010802021500号
    举报电话:13070156560 举报邮箱:jubao@zhiding.cn 安全联盟认证