ZD至顶网软件频道消息:12月9日,阿里云宣布数据库产品 HybridDB 正式商业化。HybridDB(ApsaraDB HybridDB)是一款在线MPP大规模并行处理数据仓库的服务。它基于 Pivotal 公司的开源数据库项目 Greenplum Database 开发,并由阿里云数据库团队在云计算架构下深度扩展。
该服务支持了OSS存储、JSON数据类型、HyperLogLog预估分析等功能特性。通过符合SQL2008标准查询语法及OLAP分析聚合函数,提供灵活的混合分析能力。提供在线扩容、备份、性能监测等服务。
阿里云数据库产品研究员褚霸介绍,随着各行各业信息技术的发展催生了以数据分析场景为主要业务的企业。特别是物联网和广告分析领域的企业,对云上复杂场景数据分析有强需求。“这个产品可以简化大量工作,如数据库管理员、开发者以及数据分析师可以专注于如何通过 SQL 挖掘数据价值,无需再自行维护复杂的大规模并行数据集群。”
HybridDB 是此款产品的名字,也体现了“混合”的特点。HybridDB 兼容数据类型多达23种,比市面上云计算厂商的同类产品多一倍。同时,它支持横向扩展,当用户数据量变大,内存及CPU计算能力需求增大时,随时可以添加节点,以线性扩展分析性能,提高计算能力。
7月公测以来的数据显示,JSON 和 GIS 类型的数据量高达TB级别时,查询也可以在1秒内完成。此外,广告分析领域的公司在做互联网海量数据的 PV、UV 预估分析时,统计性能提升20-100倍。
在MySQL和ProstgreSQL之外,数据库用户为什么还需要全新的产品?褚霸表示,HybridDB的混合数据类型及混合存储(行存、列存、OSS外部表)能力,可以与阿里云现有的RDS、NoSQL数据库方案实现数据融合分析。同时补全了EMR(Hadoop)分析场景中实时性不足的问题,为用户提供基于开源OLTP、OLAP、BigData生态的一站式解决方案。
Greenplum 诞生于2006年,是一个分布式大规模并行处理数据库,常用于大数据的存储引擎、计算引擎和分析引擎。它和HybridDB将形成云上云下业务场景的互补,软件开发过程中,云上HybridDB环境与云下Greenplum商业版本、Greenplum Database开源版本环境可以采用同一套代码,节省开发及维护成本。
阿里云数据库团队的愿景是打造一站式在线分析引擎。从数据的传输、存储、计算到管理,让客户的数据需求能够在同一个产品环境体系内实现,进一步降低数据处理的整体成本。未来,阿里云将围绕 HybridDB 做数据库生态的努力。一方面,加速与阿里云数据类产品实现互通,让用户可以通过SQL快速分析从不同渠道存储下来的数据。另一方面,引入合作伙伴认证机制,邀请更多ISV开发商及BI/ETL厂商支持,共同为用户创造价值。
实时分析
支持SQL语法进行分布式GIS地理信息数据类型实时分析,协助物联网、互联网实现LBS位置服务统计
支持SQL语法进行分布式JSON、XML、模糊字符串等数据实时分析,助金融、政企行业实现报文数据处理及模糊文本统计
稳定可靠
支持分布式ACID数据一致性,实现跨节点事务一致,所有数据双节点同步冗余
分布式部署,计算单元、服务器、机柜三重防护,提高重要数据基础设施保障
简单易用
丰富的OLAP SQL语法及函数支持,众多Oracle函数支持,业界流行的BI软件可直接联机使用
可与云数据库RDS(PostgreSQL/PPAS)实现数据通讯,实现OLTP+OLAP(HTAP)混合事务分析解决方案
性能卓越
支持行列混合存储,列存性能在OLAP分析时相比行存储可达100倍性能提升
支持高性能OSS并行数据导入,避免单通道导入的性能瓶颈
灵活扩展
按需进行计算单元,CPU、内存、存储空间的等比扩展,OLAP性能平滑上升致数百TB
支持透明的OSS数据操作,非在线分析的冷数据可灵活转存到OSS对象存储,数据存储容量无限扩展
好文章,需要你的鼓励
科技亿万富翁拉里·埃里森资助的研究团队将向英国牛津大学投资1.18亿英镑,用于将AI技术应用于疫苗研究。牛津疫苗研究小组将领导这一项目,研究人体免疫系统对严重细菌感染和抗生素耐药性的反应。该项目由曾主导新冠疫苗试验的安德鲁·波拉德教授领导,计划采用人体挑战模型,让志愿者在受控条件下接触细菌,然后运用现代免疫学和AI工具来精确识别预测保护效果的免疫反应,以开发针对致命疾病的创新疫苗。
伦斯勒理工学院研究团队通过网络科学方法首次系统揭示了大语言模型的内部"认知架构"。研究发现AI模型采用类似鸟类大脑的弱定位架构,模块间通过分布式协作而非专业化分工来处理认知任务。这一发现颠覆了基于功能模块优化的传统思路,指出应充分利用网络级协作来提升AI性能。
据报道,ChatGPT开发商OpenAI计划在印度建设一座耗电量超过1吉瓦的数据中心,目前正寻找当地合作伙伴。该设施预计可容纳至少5.9万片英伟达B200芯片。这可能是OpenAI全球数据中心计划的一部分,旨在为国际用户提供更低延迟服务。OpenAI CEO奥特曼将于下月访问印度,公司还计划年底前在新德里开设办事处。
腾讯和清华研究团队首次从数学理论角度解释了为什么AI需要外部工具。研究证明纯文本AI存在"隐形枷锁",无法突破预训练的能力边界,而工具集成能打破这种限制,让AI获得全新的问题解决策略。团队还开发了ASPO算法,解决了训练AI更早使用工具的技术难题。实验显示配备工具的AI在数学问题上全面超越纯文本版本,展现出三种新奇认知模式,为构建更强大的AI系统提供理论指导。