至顶网软件与服务频道消息:12月13日,全球前三的云计算公司阿里云公布了最新的弹性计算服务等级协议SLA,单实例的可用性从99.95%提升至99.975%,多可用区多实例可用性从99.99%提升至99.995%,均为全球最高水准。
SLA即服务等级协议,代表了云服务商承诺提供的计算服务所能达到的服务质量和标准。若阿里云提供的服务时间未达到承诺的标准,则将依据协议作出赔偿。
越来越多的企业正在用云计算代替本地数据中心和虚拟化平台,主因之一就是传统IT难以企及云计算的超高SLA,通常情况下,云厂商的SLA是线下数据中心的5倍以上,而云的成本则是线下数据中心的几分之一。
从99.99%提升至99.995%,简单的数字变化背后,是过去十年阿里云为云计算稳定性做出的努力。
阿里云从成立的第一天起,就在稳定性上进行了大量的技术投入和建设,经过十年的技术探索,基于自研的飞天大规模操作系统自研服务器、网络、存储、智能调度等技术,不仅大幅提升了系统的稳定性,还可预测感知系统异常,运用热迁移等技术保障客户业务不受影响,最终实现超高的SLA标准。
除了升级SLA之外,阿里云还提供了企业级云灾备解决方案:为制造、金融、医疗等企业提供一键容灾能力,例如业务恢复、数据保护和网络自愈,最大程度保护本地和云上业务稳定运行。
“一直以来,阿里云都始终坚持自主研发,我们挑剔和控制掌握每一行代码,就是为了向用户提供更加稳定与可靠的服务,保障永不停机的计算服务,是我们的使命,”阿里云基础产品事业部总经理蒋江伟表示。
好文章,需要你的鼓励
苏州大学研究团队提出"语境降噪训练"新方法,通过"综合梯度分数"识别长文本中的关键信息,在训练时强化重要内容、抑制干扰噪音。该技术让80亿参数的开源模型在长文本任务上达到GPT-4o水平,训练效率比传统方法高出40多倍。研究解决了AI处理长文档时容易被无关信息干扰的核心问题,为文档分析、法律研究等应用提供重要突破。
在Cloudera的“价值观”中,企业智能化的根基可以被概括为两个字:“源”与“治”——让数据有源,智能可治。
清华大学团队首次揭示了困扰AI训练领域超过两年的"幽灵故障"根本原因:Flash Attention在BF16精度下训练时会因数字舍入偏差与低秩矩阵结构的交互作用导致训练崩溃。研究团队通过深入分析发现问题源于注意力权重为1时的系统性舍入误差累积,并提出了动态最大值调整的解决方案,成功稳定了训练过程。这项研究不仅解决了实际工程问题,更为分析类似数值稳定性挑战提供了重要方法论。