9月26日,在阿里云数据库创新上云峰会上,阿里云重磅发布首个一站式敏捷数据仓库解决方案。该方案结合一站式数据管理平台DMS及云原生数据仓库AnalyticDB,真正实现了库仓一体的技术架构,提供在线数据实时入仓、T+1周期性快照、按需建仓等能力,数据延时低至秒级,持续赋能业务在线化,令企业在线数据释放最大价值。
这是阿里云在数据库方面的最新之作,此前阿里云拥有了丰富的数据传输同步ETL工具、全栈式的数据管理工具DMS、以及云原生数据库PolarDB和分布式版本PolarDB-X,在分析领域提供了云原生数仓AnalyticDB,阿里云一站式全链路数据管理和服务的布局也初步成形。
“未来一定会是多种数据处理引擎并存,但是面向用户、面向开发者则会有一个统一的一站式的开发管理平台,在阿里云这就是DMS,并且利用智能化技术将整个数据库的运维管理简单化、易用化,我们要为用户提供一站式全链路数据管理和服务。”阿里巴巴集团副总裁、阿里云数据库产品事业部负责人李飞飞在大会演讲时表示。

数仓一体是趋势
阿里云是数据库领域的后来者,但很快就从数据库行业的跟随者成为行业的领导者。在2020年11月,阿里云数据库首次进入Gartner数据库魔力象限的领导者行列,这是一个标志。而这一成绩的取得很大程度上基于阿里云充分利用了其在云计算技术的积累,充分发挥了云原生的优势,实现了云数据库对传统数据库的反超。
关于云数据库李飞飞有一句话经常被引用:“云数据库替代传统数据库就像汽车换马车。”这句话很好地诠释数据库的未来属于云数据。这是因为云原生给数据库提供了池化的计算资源、存储资源,让资源解耦,让数据库可以像今天使用水一样使用计算存储等资源,从而给了数据库新的技术起点。阿里云数据库正是凭借云原生的优势,才能后来居上,实现反超。
“数据库的未来一定是属于云原生+分布式,而且云原生和分布式技术还会紧密结合起来。在计算模型上会将传统数据库MPP架构、交互式分析的技术和传统离线的大数据技术结合起来,数据处理引擎将既能做离线复杂的计算、也能支持在线的交互式分析和事务处理。”李飞飞在接受记者采访时表示。

正是基于这一观点,阿里云致力于数仓一体,向HTAP演进。李飞飞表示,HTAP传统技术是在原来的副本(一般是3副本)之外多准备几个副本,这几个副本专门支持数据分析业务。阿里云的办法与传统方法不同,阿里云的PolarDB本身是存算分离,在存储层数据很容易打通,通过PolarDB本身就可以无缝得到OLTP和OLATP的体验,而无需像传统技术那样要通过ETL工具来完成数据从数据库到数据仓库的迁移。
李飞飞透露,阿里云还在研究结合傲腾可持久内存技术实现PolarDB对HTAP的支持,方法类似SAP HANA,将数据放到可持久内存,在这里完成行列的重组,从而实现HTAP的功能。当然,这些放到内存的列是经过选择的,不是全部数据。这一技术很快就会对外发布。
除了HTAP之外,李飞飞表示,数据库的未来还有两个重点发展趋势,就是智能化和安全可信。随着AI技术的进步,AI会越来越多地被应用到数据库的管理和运维上,数据库未来会走向高度自治。其次,安全可信未来也会越来越重视,全加密数据,行、列级的加密会越来愈普遍。
以开源加速产品迭代
今年5月阿里云宣布开源PolarDB,并率先开源了PolarDB for PostgreSQL,让业界为之一惊。很显然,在开源这件事情上阿里云是认真的。在本次大会上,阿里云宣布将开源又一款数据库PolarDB-X,这是PolarDB的分布式版本。
阿里云为什么会开源这两款数据库,在开源方面未来会有什么打算?李飞飞告诉记者,对于开源阿里云有两重考虑:一个社会价值,一个是商业价值。对于像阿里云这样规模的企业,是应该为行业、为产业做些贡献,让更多的企业从阿里云的技术中受益,从而实现社会价值。通过社会价值的实现,阿里云收获更多用户从而带来经济价值,这是一个好的发展路径。而单就商业价值而言,阿里云希望通过开源带来更多技术人员的关注和用户的使用,从而加速产品的迭代,让产品不断完善,功能不断丰富,最后带来经济价值。
而为什么要开源PolarDB for PostgreSQL?李飞飞说,这是因为PostgreSQL现在生态比较好,有各种各样版本的PostgreSQL数据库,但还没有一个真正云原生的数据库,把阿里云的核心云原生能力提供给开源社区,帮助构建一个云原生PostgreSQL数据库的生态,这是阿里云的初衷。而开源PolarDB-X是想构建一个原生的分布式开源生态。
不过,李飞飞表示,阿里云没有把数据库全部开源的计划,特别是一些企业级的特性不会考虑开源。他说,阿里云希望看到的是,通过开源让阿里云数据库产品技术得到广泛应用,并且愿意参与到技术产品的迭代过程中。而在一些高阶的能力上,有阿里云团队专业能力和阿里云服务的能力,并形成良好的商业合作伙伴,两者之间相辅相成,共同促进阿里云数据库的技术进步和阿里云数据库在各个行业的落地,为中国的数字经济发展助力。
好文章,需要你的鼓励
穆拉蒂时隔18个月首次接受重大媒体采访,介绍其创立的Thinking Machines Lab正在开发的"交互模型"。该模型能以200毫秒间隔处理音频、文本和视频流,捕捉人类交流中的中断、修正和停顿。她还谈及OpenAI"政变周"经历,强调行业决策权过于集中的担忧,并回应了公司近期研究人员离职问题,表示这是初创实验室的正常波动。
STATE16研究院这篇综述发现,物理AI系统存在"静默失效"风险——AI以高度自信执行基于错误世界信息的动作,却不触发任何报警,并提出在AI输出与物理执行之间建立独立授权层的框架。
本期《Quick Charge》播客涵盖多个热点话题:特斯拉疑似试图删除FSD欺诈相关证据以规避巨额赔付;卡特彼勒持续推进建筑领域电气化布局;住宅太阳能30%税收抵免即将到期。此外,嘉宾Tom Pacheco就高压系统与电池技术培训展开探讨,强调电动车技术人才培养的紧迫性。节目同时提醒有意安装太阳能的用户尽快行动,可通过EnergySage平台比较多家安装商报价。
UIUC与微软联合研发的OpenWebRL框架让4B小模型仅凭400条初始数据,通过在真实网站上边做边学的强化学习方式,在网页智能体基准上超越了用27万条数据训练的竞争对手。