阿里云发布敏捷数仓,加快一站式全链路数据管理与服务布局

作者:邹大斌   【原创】   2021-09-30 16:55:08

关键字: 数据库 阿里云

阿里云拥有了丰富的数据传输同步ETL工具、全栈式的数据管理工具DMS、云原生数据库PolarDB和分布式版本PolarDB-X,在分析领域提供了云原生数仓AnalyticDB,阿里云一站式全链路数据管理和服务的布局已经初步成形。

9月26日,在阿里云数据库创新上云峰会上,阿里云重磅发布首个一站式敏捷数据仓库解决方案。该方案结合一站式数据管理平台DMS及云原生数据仓库AnalyticDB,真正实现了库仓一体的技术架构,提供在线数据实时入仓、T+1周期性快照、按需建仓等能力,数据延时低至秒级,持续赋能业务在线化,令企业在线数据释放最大价值。

这是阿里云在数据库方面的最新之作,此前阿里云拥有了丰富的数据传输同步ETL工具、全栈式的数据管理工具DMS、以及云原生数据库PolarDB和分布式版本PolarDB-X,在分析领域提供了云原生数仓AnalyticDB,阿里云一站式全链路数据管理和服务的布局也初步成形。

“未来一定会是多种数据处理引擎并存,但是面向用户、面向开发者则会有一个统一的一站式的开发管理平台,在阿里云这就是DMS,并且利用智能化技术将整个数据库的运维管理简单化、易用化,我们要为用户提供一站式全链路数据管理和服务。”阿里巴巴集团副总裁、阿里云数据库产品事业部负责人李飞飞在大会演讲时表示。

阿里云发布敏捷数仓,加快一站式全链路数据管理与服务布局

数仓一体是趋势

阿里云是数据库领域的后来者,但很快就从数据库行业的跟随者成为行业的领导者。在2020年11月,阿里云数据库首次进入Gartner数据库魔力象限的领导者行列,这是一个标志。而这一成绩的取得很大程度上基于阿里云充分利用了其在云计算技术的积累,充分发挥了云原生的优势,实现了云数据库对传统数据库的反超。

关于云数据库李飞飞有一句话经常被引用:“云数据库替代传统数据库就像汽车换马车。”这句话很好地诠释数据库的未来属于云数据。这是因为云原生给数据库提供了池化的计算资源、存储资源,让资源解耦,让数据库可以像今天使用水一样使用计算存储等资源,从而给了数据库新的技术起点。阿里云数据库正是凭借云原生的优势,才能后来居上,实现反超。

“数据库的未来一定是属于云原生+分布式,而且云原生和分布式技术还会紧密结合起来。在计算模型上会将传统数据库MPP架构、交互式分析的技术和传统离线的大数据技术结合起来,数据处理引擎将既能做离线复杂的计算、也能支持在线的交互式分析和事务处理。”李飞飞在接受记者采访时表示。

阿里云发布敏捷数仓,加快一站式全链路数据管理与服务布局

正是基于这一观点,阿里云致力于数仓一体,向HTAP演进。李飞飞表示,HTAP传统技术是在原来的副本(一般是3副本)之外多准备几个副本,这几个副本专门支持数据分析业务。阿里云的办法与传统方法不同,阿里云的PolarDB本身是存算分离,在存储层数据很容易打通,通过PolarDB本身就可以无缝得到OLTP和OLATP的体验,而无需像传统技术那样要通过ETL工具来完成数据从数据库到数据仓库的迁移。

李飞飞透露,阿里云还在研究结合傲腾可持久内存技术实现PolarDB对HTAP的支持,方法类似SAP HANA,将数据放到可持久内存,在这里完成行列的重组,从而实现HTAP的功能。当然,这些放到内存的列是经过选择的,不是全部数据。这一技术很快就会对外发布。

除了HTAP之外,李飞飞表示,数据库的未来还有两个重点发展趋势,就是智能化和安全可信。随着AI技术的进步,AI会越来越多地被应用到数据库的管理和运维上,数据库未来会走向高度自治。其次,安全可信未来也会越来越重视,全加密数据,行、列级的加密会越来愈普遍。

以开源加速产品迭代

今年5月阿里云宣布开源PolarDB,并率先开源了PolarDB for PostgreSQL,让业界为之一惊。很显然,在开源这件事情上阿里云是认真的。在本次大会上,阿里云宣布将开源又一款数据库PolarDB-X,这是PolarDB的分布式版本。

阿里云为什么会开源这两款数据库,在开源方面未来会有什么打算?李飞飞告诉记者,对于开源阿里云有两重考虑:一个社会价值,一个是商业价值。对于像阿里云这样规模的企业,是应该为行业、为产业做些贡献,让更多的企业从阿里云的技术中受益,从而实现社会价值。通过社会价值的实现,阿里云收获更多用户从而带来经济价值,这是一个好的发展路径。而单就商业价值而言,阿里云希望通过开源带来更多技术人员的关注和用户的使用,从而加速产品的迭代,让产品不断完善,功能不断丰富,最后带来经济价值。

而为什么要开源PolarDB for PostgreSQL?李飞飞说,这是因为PostgreSQL现在生态比较好,有各种各样版本的PostgreSQL数据库,但还没有一个真正云原生的数据库,把阿里云的核心云原生能力提供给开源社区,帮助构建一个云原生PostgreSQL数据库的生态,这是阿里云的初衷。而开源PolarDB-X是想构建一个原生的分布式开源生态。

不过,李飞飞表示,阿里云没有把数据库全部开源的计划,特别是一些企业级的特性不会考虑开源。他说,阿里云希望看到的是,通过开源让阿里云数据库产品技术得到广泛应用,并且愿意参与到技术产品的迭代过程中。而在一些高阶的能力上,有阿里云团队专业能力和阿里云服务的能力,并形成良好的商业合作伙伴,两者之间相辅相成,共同促进阿里云数据库的技术进步和阿里云数据库在各个行业的落地,为中国的数字经济发展助力。

    扫一扫

    分享文章到微信


    北京第二十六维信息技术有限公司(至顶网)版权所有. 京ICP备15039648号-7 京ICP证161336号京公网安备 11010802021500号
    举报电话:010-62641205-5060 举报邮箱:jubao@zhiding.cn 安全联盟认证