全球权威的IT咨询公司Gartner于上周发布了2018年数据库系统的魔力象限。在这份具有风向标意义的数据库行业评估报告中,展示了两大变化:第一,云计算厂商集体上榜,挑战甲骨文等传统数据库厂商地位;阿里云首次入榜即成为黑马,进入 “远见者”象限。
趋势:云数据库成为新战场
数据库与操作系统、中间件并称为核心基础软件,在IT软件堆栈中起着中流砥柱的作用,今天运行的绝大多数企业应用软件都离不开数据库的支持。
过去多年,数据库技术本质上来说没有什么颠覆性的发展。拥有先发优势的甲骨文、微软、IBM等老牌IT厂商长期垄断市场。
但是,在互联网、移动和物联网等应用的新场景之下,图片、音频、视频等非结构化数据开始有了爆炸性增长,传统数据库已经不堪重负,企业客户急切需要新的数据库产品。
在云计算技术不断成熟的背景之下,云数据库开始崛起,并因为按需扩展、按需付费等特性获得了大量中小企业及互联网企业客户的拥护。
截至目前,全球主流的云计算厂商,亚马逊AWS、谷歌、阿里云等都进入了这个市场,并向传统数据厂商发起挑战。
Gartner最新数据显示,甲骨文、微软和IBM三家企业2011年在数据库市场的累计市场份额占到84%,但是在2017年三家厂商份额降至71%。
这些老牌数据库厂商丢失的市场份额,显然正是被新兴的云数据库厂商和开源数据库厂商夺去。
阿里云成为最大黑马
在本次魔力象限报告里,阿里云成为了唯一一家入选的中国厂商。Gartner数据库魔力象限的评选标准包括全球市场份额、产品能力、客户反馈等。2013年Gartner首次推出这一魔力象限,国内厂商此前从未入选。
首次入选就进入了挑战者象限,这也反映了阿里云在数据库领域的强大实力。
事实上,阿里巴巴的业务场景对于数据库有很高的要求,为此阿里云过去多年一直在思考数据库产品的创新,并持续加大在数据库产品的技术投入。
2008年开始,阿里巴巴提出向互联网架构转型的战略,通过自主研发和替代性方案(比如采用MySQL和Hadoop)来重构自己的数据系统,接下来的事大家都知道了,云计算改变了公司的IT基础架构。
在这个过程中,阿里云不断创新数据库技术,并打造了广泛的数据库产品组合。现在,数据库产品家族涵盖RDS等开源数据库、商业数据库以及PolarDB等自研数据库产品,几乎能够为所有客户的业务场景提供多种解决方案,目前在全球已经拥有10万客户、20万实例,客户涵盖了金融、电信、制造、物流等领域的国内外龙头企业,例如中石化、中国联通、上汽大众、天弘基金以及三星等。
在数据库软件市场上,中国厂商起步较晚,缺乏市场影响力,但是在云计算时代,阿里云让中国厂商看到了突围数据库软件市场的可能。
好文章,需要你的鼓励
这项由加州大学圣地亚哥分校和微软研究院合作开发的REAL框架,通过程序分析反馈训练大型语言模型生成高质量代码。与传统方法不同,REAL采用强化学习将代码安全性和可维护性作为奖励信号,不依赖人工标注或特定规则。研究在多个数据集上的实验表明,REAL在保证功能正确性的同时显著提高了代码质量,有效解决了"即兴编程"中的安全漏洞和维护性问题,为AI辅助编程提供了新的范式。
加州大学伯克利分校与Meta FAIR研究团队开发了"Self-Challenging"框架,让大语言模型通过自己创建和解决任务来提升能力。该方法引入创新的"Code-as-Task"格式,包含指令、验证函数、示例解决方案和失败案例,确保生成的任务既可行又有挑战性。在工具计算、网页浏览、零售服务和航班预订四种环境测试中,仅使用自生成训练数据,Llama-3.1-8B模型性能提升了两倍多,证明AI可以通过自我挑战实现有效学习,减少对人类标注的依赖。
南洋理工大学与SenseTime Research合作提出了PoseFuse3D-KI,一种创新的人体中心关键帧插值框架。该方法将3D人体模型信息融入扩散过程,解决了现有技术在处理复杂人体动作时产生扭曲结果的问题。研究团队开发了专门的SMPL-X编码器直接从3D空间提取几何信息,并设计了融合网络将3D线索与2D姿态无缝整合。他们还构建了CHKI-Video数据集,包含2,614个视频片段及完整的人体标注。实验结果显示,PoseFuse3D-KI在PSNR上提升9%,LPIPS减少38%,显著超越现有方法。
这项研究提出了LongGuide算法,解决了大型语言模型在长文本生成任务中的局限性。研究团队发现,仅依靠上下文学习无法使模型充分掌握文本的语言和格式特性。LongGuide通过自动生成两种指导原则:度量指导原则和输出约束指导原则,显著提升了模型性能。在七种长文本生成任务中,该方法使开源和闭源模型的ROUGE-L评分平均提高约6%。LongGuide具有通用性强、易于学习、成本效益高等优点,为提升AI长文本生成能力提供了新方向。