至顶网软件频道消息:Oracle可能仍然是最大的数据库(当今数据驱动型企业的基础之一)提供商,而Amazon希望全世界都知道,数据库不仅仅是这个古老巨头的品牌。
在今天的博客文章中,Amazon首席技术官Werner Vogels详细阐述了AWS云服务上提供的6种数据库相比主流商用数据库来说,提供了不止是现代化企业参与竞争所需要的一切。
科技界的许多人都知道这一点,这篇文章没有公布什么重大新闻。但是在接受采访时Vogels表示,他想要解释为什么如今的应用不再仅仅依赖于几十年来一直支配该领域的“关系型”数据库。
他说:“一刀切型庞大数据库的日子已经过去。我们的客户正在改变他们开发应用的方式,他们需要特定的数据库来完成这些工作。”
云原生
他说,如果说AWS的不同数据库都有一个统一主题的话,那么就是支持以云原生的方法来创建应用,这些应用不是由数据需要存储在单一数据库的方式驱动的。相反,云应用(通常由广泛分布在多个数据中心和云中的较小代码组成)驱动着数据被访问和被使用的方式。 Vogels认为,不同类型的应用需要不同类型的数据库。
他说:“应用开发领域正在发生变化。如果你想用正确的工具瞄准客户的话,你就需要各种各样的数据库。”
乍看之下,这篇博客文章似乎是AWS对Oracle的抨击,当然AWS首席执行官Andy Jassy从不惧于和Oracle针锋相对,而且今年早些时候有报道称,作为Oracle的客户,AWS正在逐步转向使用自己的数据库。而且Oracle方面也在云领域把矛头对准了AWS。最近,Oracle宣称具备“自主”的数据库能力,希望能够放缓很多公司把云计算大单给了Amazon、微软和谷歌等公司。
但是,Oracle此举似乎并没有对AWS产生太大影响,AWS最近一个季度的收入增长了49%,达到54亿美元,甚至比前一季度增长还要快。此外Vogels指出,自2016年初推出迁移服务以来,AWS已经看到有750000个从其他数据库向AWS云的迁移,远远多于2017年年初的20000个。
也就是说,Oracle已经感到了竞争热度,并开始以帮助本地客户迁移到Oracle云的服务来作为回应。Wikibon分析师James Kobielus最近说,他认为Oracle的这项服务正在快速取得成功。
超越Oracle
不过,Oracle可能并不是主要目标。Kobielus说,他认为Vogels是想更多地针对数十个独立的专业数据库提供商。
“AWS现在推出这一产品线的原因很简单,因为在IBM及Oracle多年来耕耘的同个领域内构建或者收购专有数据库产品来说,他们已经成功重塑了发展的车轮。他们有充分的理由宣称,他们可以解决任何客户可能提出的任何数据/分析需求,而无需将诸如合作伙伴之类的非AWS数据库纳入其中。”
无论如何,Vogels解释了Amazon本身是如何得出这样的结论:Amazon不再依赖关系型数据库,关系型数据库是具有预定义关系的数据集合,作为具有列和行的一系列表组合起来的。
当2004年节假期因为扩展问题导致多次重大中断事故后,Amazon建立了自己的DynamoDB“关键价值”数据库。Amazon意识到有大约70%的操作是所谓的键值查找,也就是不需要在行中查找大量数据。这种更简单的数据库以比行和列更类似于字典或地图的方式存储数据,从而更快速递访问如游戏、数字广告服务和物联网等应用。
自那时起,一直利用崛起的替代性开源数据库进行构建的Amazon,开始提供更多类型的数据存储,包括一种名为Amazon ElastiCache的内存数据库,可为实时分析和排行榜等应用提供非常快的响应时间;还有Elasticsearch Service,是针对用于软件故障排除和价格优化的近实时可视化。例如,Expedia使用超过150个ES“域”,涉及30TB数据和300亿个文档。
而去年秋天在AWS的re:Invent大会上推出的Neptune的图形数据库,已经于5月30日全面上市。Thomson Reuters使用Neptune帮助企业应对复杂的全球税收政策,也有企业把Neptune用于欺诈检测、游戏内推荐和其他应用。
不仅如此,Amazon拥有自己的云关系型数据库Aurora,因为很明显这对很多应用来说仍然大有用处。事实上AWS在4月份表示,Aurora是AWS历史上增长最快的服务,在过去的一年中,活跃客户数翻了一番。
AWS数据库
Vogels称,AWS自己的企业客户正在寻找替代选择,这也是很普遍的现象。“由于我们的许多企业客户都在从内部迁移到云中,希望摆脱商业数据库,主要是因为许可限制和成本控制不足等因素。”
他指出,现在许多公司在他们不同的业务板块中使用多个Amazon数据库。“我们看到AWS很多客户正在使用多种数据库。他们为每个应用寻找最好的工具,或者寻找多种工具。”
例如,Airbnb使用DynamoDB存储用户的搜索历史记录,使用ElastiCache存储站点会话以加快站点呈现速度,使用另一个AWS关系型数据库——RDS上的MySQL作为主要的事务型数据库。除了Elasticsearch之外,Expedia还使用Aurora、ElastiCache和Amazon Redshift数据仓库。
尽管如此,AWS可能还是会对那些希望将更多工作转移到云中的企业进行售卖。图形数据库公司DataStax客户体验和图解解决方案主管Jonathan Lacefield去年年底曾表示,新数据库确实需要重建应用,而且与使用关系型数据库的方式是不同的。
图形数据库制造商Neo4j首席科学家Jim Webber表示:“最大的挑战是教育;还有其他方式,但意味着要学习新的东西。如果我得到的只是一把锤子,那么每一个问题都是钉子。而关系型数据库是一个美丽的锤子。”
Vogels表示,他认为未来会开发出更多类型的数据库,以适应信息技术的进一步创新。
好文章,需要你的鼓励
研究人员正探索AI能否预测昏迷患者的医疗意愿,帮助医生做出生死决策。华盛顿大学研究员Ahmad正推进首个AI代理人试点项目,通过分析患者医疗数据预测其偏好。虽然准确率可达三分之二,但专家担心AI无法捕捉患者价值观的复杂性和动态变化。医生强调AI只能作为辅助工具,不应替代人类代理人,因为生死决策依赖具体情境且充满伦理挑战。
哥伦比亚大学研究团队开发了MathBode动态诊断工具,通过让数学题参数按正弦波变化来测试AI的动态推理能力。研究发现传统静态测试掩盖了AI的重要缺陷:几乎所有模型都表现出低通滤波特征和相位滞后现象,即在处理快速变化时会出现失真和延迟。该方法覆盖五个数学家族的测试,为AI模型选择和部署提供了新的评估维度。
麻省理工学院研究发现过度依赖AI会导致认知债务,削弱基本思维能力。研究表明交替进行无辅助思考和AI支持工作的模式能保持认知敏锐度。这种认知高强度间歇训练模仿体能训练中的HIIT模式,通过短时间高强度思考与恢复期交替进行,可以强化大脑神经回路,防止认知衰退,提升独立思考能力。
这项研究首次发现AI推理模型存在"雪球效应"问题——推理过程中的小错误会逐步放大,导致AI要么给出危险回答,要么过度拒绝正常请求。研究团队提出AdvChain方法,通过训练AI学习"错误-纠正"过程来获得自我纠错能力。实验显示该方法显著提升了AI的安全性和实用性,用1000个样本达到了传统方法15000个样本的效果,为AI安全训练开辟了新方向。