云数据库提供商之间有一个普遍说法,就是他们正在从Oracle赢走大量迁移过来的客户,按理说,Oracle的市场应该正在萎缩。
然而,Oracle持续表现出强劲的增长,年均按照美元计算的有机增长率为8%,其中包括来自云数据库的大幅增长。此外,Oracle的Autonomous Database每小时处理的查询也要比竞争对手的服务更多。
这是怎么回事?尽管传统观点认为,企业正在放缓云消费的增长,但事实上云转型的趋势长期存在,并且随着时间的推移,这股浪潮正在掀起波澜。
ChatGPT包揽了今年的热点话题,它的推出促进了AI,尤其是生成式AI,但生成式AI其实是一段旅程,而我们才刚刚起步——就像去年主导数据领域的数据网格一样。
其共同点是这一切都需要数据,而且还需要云的持续增长。这就是Oracle的云战略有趣的地方。
当谈论超大规模数据中心企业的时候,你通常不会第一个想到Oracle。AWS和微软的Azure,其次是Google Cloud,往往都是在OCI之前被首先提及。
不会被第一个想到,这不仅是在超大规模数据中心企业,还在数据库领域,Oracle的Autonomous Database每小时处理的查询数是Snowflake的很多倍,但是Snowflake却经常成为人们关注的焦点。
Oracle意识到自己在云领域正在扮演一个挑战者角色。Oracle声称自己的Autonomous Database价格低于Amazon Redshift。
转向多云
Oracle和企业计算巨头IBM以及SAP一样,已经从以其自身为中心的、单一中心的观点转向多极化了,或者更具体地说,转向了多云世界。除了小型企业,对于大多数中型到大型企业来说,多云是他们已经在计划中或者默认的规则。
Oracle的OCI之旅显然是第二代初学者的旅程,它吸取了前人教训。从技术上讲,Oracle几乎是从零开始的。我们说“几乎”,是因为Oracle的确拥有第一代云架构,但随后又弃用了第二代云架构,从头开始重塑了云基础架构。
Oracle从扁平化网络拓扑开始,消除了大型的、多样化的云数据中心中不可避免的跃点,并利用远程直接内存访问协议(RDMA)等创新,其云网络上的分布式节点可以从彼此的远程缓存上相互读取或写入数据,而无需导航CPU或者操作系统的开销。尽管大多数超大规模数据中心企业都在吹捧商用硬件的经济性,但除非你真正拥有并指定整个硬件堆栈,否则RDMA是不可能的。
从实用的角度来看,这让Oracle数据库能够跨多个物理实例运行,就好像是虚拟实例一样。结合扁平化的高带宽网络拓扑,使得大部分Oracle云数据中心像一台超级计算机一样运行。这就是计算方面。至于存储,Oracle和WEKAIO展开合作,为高性能计算裸机计算实例类型提供高带宽结构。
另一块版图是多云:Oracle意识到OCI不会是客户群的唯一选择。几年前,Oracle和微软签署了一项协议,在OCI和Azure数据中心之间建立直接网络连接,这一举措出乎我们的意料,这么做是为了通过云之间的低延迟专用连接实现互操作性。
此举相当于敌人的敌人聚在了一起,那些通常使用Microsoft 365和Oracle数据库的联合客户,将两者推向了联姻。
在大多数情况下,这些互连的距离非常短。由于大家一般都倾向于将他们的云数据中心定位在靠近主要市场的地方,因此彼此之间距离很近,因此这些互连通常位于同一建筑物或距离园区很短车程的另一建筑物中。
有一家使用多项Azure服务的欧洲客户发现,与使用其他Azure服务相比,通过互连(控制平面位于Azure中,Exadata实例位于OCI中)使用Oracle Exadata Database Service的情况下,IOPS基准测试速度提高了30%。现在,在OCI的41个“区域”,有12个具有Azure互连。
回顾一下Oracle的多云战略。在个别情况下,例如MySQL HeatWave on AWS,涉及在国外本地实施和托管Oracle数据库服务。但考虑到Oracle的数据库云服务针对硬件进行了优化,因此HeatWave on AWS将成为证明规则的一个例外。客户把Oracle和Azure结合在一起,Oracle预计,这些客户会给其他超大规模数据中心企业施加同样的而影响。
在第三方云服务方面,AWS的合作由来已久。根据SKU的数量,AWS提供了比其他任何人都更适合各种用途的数据库服务,我们最后估计为16个,具体取决于你把什么算作数据库服务。
四年前,AWS推出了MongoDB杀手——DocumentDB。然而,就在去年,两家厂商签署了一项为期六年的联合上市合作伙伴关系。当AWS的EC2端嗅到收入机会时,它可能会成为最好的“亦敌亦友”。
区域饱和度
另一面是OCI的世界征服战略,即用OCI“区域”来占领世界。
这里的区域带双引号,因为对于Oracle而言,区域通常是单个数据中心,而对于AWS、Azure和Google而言,区域是指覆盖特定地理区域的两个或多个数据中心的集合。
另一点是在大多数情况下,Oracle的区域或者数据中心往往小于AWS或Azure的对应区域。这是OCI起源的产物。虽然Oracle一直寻求构建一个涵盖所有服务的多用途云,从基础设施即服务到平台即服务再到软件即服务,但与竞争对手相比,Oracle最初的业务主要面向的是利基市场,是为了迎合Oracle Database和Fusion应用的客户。
换句话说,经典的企业工作负载,而不是诞生于云端的网络或者社交网络用例。因此,需求更侧重于机架和数据中心级别的冗余,而不是看似无休止的横向扩展。
最初由其原始市场塑造的OCI区域,这种紧凑性已经成了Oracle的一种设计模板。OCI定位的一个关键部分是高性能。这在很大程度上要归功于诸如扁平网络拓扑和绕过计算和操作系统层的、基于RDMA的超级集群等技术创新。
随着Oracle扩大了业务范围,它也在寻求尽可能靠近最终客户的位置,以把传输限制转化为自己的一个优势。保持数据中心小而统一,意味着你可以使用通用的方法去更快速、更便宜地构建更多的数据中心。Oracle公司董事长、首席技术官Larry Ellison将其比作埃隆马斯克的星链,依靠成群的近地卫星来覆盖地球。Ellison也想在云计算领域做同样的事情。
Oracle还有很长的一段路要走。如今,OCI有41个区域,包括49个可用区域(数据中心),以及数量不详的美国国家安全客户秘密区域。相比之下,AWS正在运转的有31个区域,包括99个可用区域(数据中心)和450个存在点(相当于经典内容交付网络端点的云)。
Oracle和AWS都想为那些希望在自己企业内部部署AWS和OCI的客户提供预先打包的选项。此外,AWS有33个本地区域(超本地化设施)和29个Wavelength区域(与电信提供商共同托管的数据中心)。
我们认为,Oracle希望构建与AWS Local Zones类似的功能,而且是相当庞大的数量。
好文章,需要你的鼓励
OpenAI在最新博客中首次承认,其AI安全防护在长时间对话中可能失效。该公司指出,相比短对话,长对话中的安全训练机制可能会退化,用户更容易通过改变措辞或分散话题来绕过检测。这一问题不仅影响OpenAI,也是所有大语言模型面临的技术挑战。目前OpenAI正在研究加强长对话中的安全防护措施。
北航团队推出VoxHammer技术,实现3D模型的精确局部编辑,如同3D版Photoshop。该方法直接在3D空间操作,通过逆向追踪和特征替换确保编辑精度,在保持未修改区域完全一致的同时实现高质量局部修改。研究还创建了Edit3D-Bench评估数据集,为3D编辑领域建立新标准,展现出在游戏开发、影视制作等领域的巨大应用潜力。
谷歌宣布计划到2026年底在弗吉尼亚州投资90亿美元,重点发展云计算和AI基础设施。投资包括在里士满南部切斯特菲尔德县建设新数据中心,扩建现有设施,并为当地居民提供教育和职业发展项目。弗吉尼亚州长表示这项投资是对该州AI经济领导地位的有力认可。此次投资是谷歌北美扩张战略的一部分。
宾夕法尼亚大学研究团队开发出PIXIE系统,这是首个能够仅通过视觉就快速准确预测三维物体完整物理属性的AI系统。该技术将传统需要数小时的物理参数预测缩短至2秒,准确率提升高达4.39倍,并能零样本泛化到真实场景。研究团队还构建了包含1624个标注物体的PIXIEVERSE数据集,为相关技术发展奠定了重要基础,在游戏开发、机器人控制等领域具有广阔应用前景。