全球最大的开源软件基金会 Apache 软件基金会(以下简称 Apache)近日宣布京东数科主导的 Apache ShardingSphere 毕业成为 Apache 顶级项目。
Apache ShardingSphere 是一款分布式数据库中间件,该项目在京东数科逐渐发展壮大,成为业界首个 Apache 分布式数据库中间件项目。Apache ShardingSphere 目前已被 130 家以上的公司采用,其中包括京东、中国电信翼支付、中通快递、中国民生银行、哔哩哔哩等。
它由 3 个子项目组成,首字母连接起来称之为“J.P.S”的数据库生态解决方案:
Apache ShardingSphere 的亮点包括:
图注:Apache ShardingSphere 核心功能
Apache ShardingSphere 孵化器的导师 Craig Russell表示: “自从进入 Apache 孵化器以来,ShardingSphere 社区采用了 Apache Way 的自治模式,大大增加了使用者、开发者和支持该项目的人数,满足使用该项目作为数据库基础设施的云企业不断增长的需求。”
作为Apache ShardingSphere 的使用者、合作方, PingCAP 创始人 & CTO,黄东旭表示:“我很骄傲国人能做出这样一个很好的开源软件。希望 Apache ShardingSphere 在未来的道路上越走越好!”
DaoCloud产品副总裁王天青则认为:“今天企业用户面对的客户数量和场景呈级数增长,因此应用架构需要从传统的单体架构向微服务架构转型,同时需要一种更加灵活的数据治理能力,既能沿用最熟悉的关系型数据库技术,又能满足数据量不断增长以及新的数据使用场景。关系型数据库中间件正是一种合适的方案,它能够让应用继续沿用关系型数据库访问方式,同时充分合理地在分布式的场景下利用多个关系型数据库的计算和存储能力。我们调研了很多类似的开源技术,最终选择了 Apache ShardingSphere 作为 DaoCloud 数据库治理的核心组件,原因是它的符合企业需求的功能特性、开放性,可扩展性以及活跃的社区。”
MariaDB 基金会成员,Oracle ACE Director,ACMUG 副主席彭立勋说:“又一个国人主导的开源项目从 Apache 孵化毕业。开源是世界软件发展的主流方向,很高兴看到中国的企业和开发人员越来越认可和投入开源,尤其是对基础软件开源生态的投入。”
中国电信天翼电子商务有限公司技术创新中心总经理张小虎说:“在过去的两年时间里,我们一起见证了 Apache ShardingSphere 项目从小到大,这是一个充满活力的社区,也有一群不断为之贡献的提交者。”
京东数科数字技术中心运维部负责人郑灏表示:“伴随着贡献者的成长,Apache ShardingSphere 推动了众多企业的 IT 架构快速发展。京东数科未来将进一步向行业开放可拓展的数据管理服务,满足行业不断增长的需求。”
Apache ShardingSphere 项目 VP,京东数科数字技术中心架构专家张亮表示,“在冠状病毒爆发的这段时间里,社区仍然以多元化的方式积极运作。我们非常高兴的看到,项目由来自世界各地的 120 多位贡献者参与开发。我们期待更加多元化的贡献者加入社区,共建一个自由和灵活的平台级应用。”
好文章,需要你的鼓励
苏州大学研究团队提出"语境降噪训练"新方法,通过"综合梯度分数"识别长文本中的关键信息,在训练时强化重要内容、抑制干扰噪音。该技术让80亿参数的开源模型在长文本任务上达到GPT-4o水平,训练效率比传统方法高出40多倍。研究解决了AI处理长文档时容易被无关信息干扰的核心问题,为文档分析、法律研究等应用提供重要突破。
在Cloudera的“价值观”中,企业智能化的根基可以被概括为两个字:“源”与“治”——让数据有源,智能可治。
清华大学团队首次揭示了困扰AI训练领域超过两年的"幽灵故障"根本原因:Flash Attention在BF16精度下训练时会因数字舍入偏差与低秩矩阵结构的交互作用导致训练崩溃。研究团队通过深入分析发现问题源于注意力权重为1时的系统性舍入误差累积,并提出了动态最大值调整的解决方案,成功稳定了训练过程。这项研究不仅解决了实际工程问题,更为分析类似数值稳定性挑战提供了重要方法论。