11月12日,就在“双十一”后的第二天,“阿里云盘崩了”的消息一度冲上微博热搜,连同冲上热搜的还有诸如淘宝、闲鱼、钉钉等阿里云支持下的其他阿里官方产品。
据阿里云官方公告显示,此次阿里云故障发生在11月12日下午17:44左右,受到影响的产品包括OSS、OTS、SLS、MNS等多款产品,波及地区涵盖北京、上海、深圳等国内众多一二线城市,以及日韩、美国、德国等海外地区。
经过阿里云工程师紧急抢修,在经历了一个多小时的异常后,杭州、北京等地控制台和API服务陆续回复;经过三个多小时的抢修后,官方表示,受到影响的云产品在21:11均已恢复。
就在阿里云相关业务故障后不久,这一事件一度冲上了微博热搜,而这次业务故障,或将成为阿里云至今波及面最广的云服务故障。
有知乎网友表示,“自己正看着比赛,公司给我打电话说服务器502上不去了,一看钉钉群全是健康检查异常告警推送,连忙上阿里云控制台看看啥情况,结果发现控制台都登不上去,oss啥的也都进不去。”
也有知乎网友认为,这可能是受到了大公司“降本增效的影响”。
至于这次阿里云故障更深层次的影响,有业内人士指出,“由于DNS控制台也发生了故障,用户连切换流量的机会都没有了,用户只能等阿里云自己修复。”
也有业内人士告诉至顶网,”这个事件确实给了我们一个教训是‘鸡蛋不要放到一个篮子里’,关键业务还是要多云、多数据中心部署,“不过,他也指出,”如此一来,成本肯定会提升,同时备案也是个比较麻烦的事情,所以还是需要企业根据自己情况来抉择。“
实际上,这样的云服务全球故障在今年并非首例,就在上周OpenAI DevDay发布会后,OpenAI也发生了大规模宕机。
彼时,OpenAI CEO奥特曼亲自出面道歉称:
“大家对新功能的热情远超我们预期,我们原计划本周一为所有订阅者提供GPTs,但现在(周二)仍然没能实现,我们希望这个进度可以加快。
由于负载的原因,短期内我们的服务可能出现不稳定的情况,对不起。”
与此同时,海外云厂商在今年也接连宕机,外加互联网厂商对云服务成本的长期考量,让整个行业逆流迎来了一波“下云潮“。
Ruby on Rails之父David Heinemeier Hansson在今年9月发布的一篇名为《Our cloud exit has already yielded m/year in savings》的文章中就曾指出,“‘下云’为我们节省的费用已经一路攀升到了每年200万美元左右,五年内将达到1000万美元。”
而像David Heinemeier Hansson一样,通过购买服务器,自己在本地搭建私有云的方式取代以往购买公有云服务的方案,在国外已经形成了一股新的潮流。
数字化是当代企业转型的大势所趋,然而,在接下来企业数字化转型过程中,基于对安全性和成本的双重考量,私有云、多云、混合云也将成为更多企业需要认真考虑的数字化方案。
好文章,需要你的鼓励
这篇研究论文介绍了"Speechless",一种创新方法,可以在不使用实际语音数据的情况下训练语音指令模型,特别适用于越南语等低资源语言。研究团队通过将文本指令转换为语义表示,绕过了对高质量文本转语音(TTS)系统的依赖。该方法分三个阶段:首先训练量化器将语音转为语义标记;然后训练Speechless模型将文本转为这些标记;最后用生成的合成数据微调大型语言模型。实验表明,该方法在越南语ASR任务中表现出色,为低资源语言的语音助手开发提供了经济高效的解决方案。
《Transformer Copilot》论文提出了一种革命性的大语言模型微调框架,通过系统记录和利用模型训练过程中的"错误日志"来提升推理性能。研究团队受人类学习者记录和反思错误的启发,设计了一个"副驾驶"模型来辅助原始"驾驶员"模型,通过学习错误模式并在推理时校正输出。这一方法在12个基准测试上使模型性能提升高达34.5%,同时保持计算开销最小,展现了强大的可扩展性和可迁移性,为大语言模型的优化提供了全新思路。
德克萨斯大学Austin分校的研究团队提出了RIPT-VLA,一种创新的视觉-语言-动作模型后训练范式。该方法通过让AI模型与环境互动并仅接收简单的成功/失败反馈来学习,无需复杂的奖励函数或价值模型。实验证明,RIPT-VLA能显著提升现有模型性能,在轻量级QueST模型上平均提升21.2%,将大型OpenVLA-OFT模型推至97.5%的前所未有成功率。最令人惊叹的是,仅用一个示范样本,它就能将几乎不可用的模型在15次迭代内从4%提升至97%的成功率,展现出卓越的数据效率和适应能力。
北京大学与华为诺亚方舟实验室研究团队共同开发了TIME基准,这是首个专为评估大语言模型在真实世界场景中的时间推理能力而设计的多层级基准。该研究提出了三个层级的时间推理框架,包含11个细粒度任务,并构建了涵盖38,522个问答对的数据集,针对知识密集型信息、快速变化的事件动态和社交互动中的复杂时间依赖性三大现实挑战。实验结果表明,即使是先进模型在构建时间线和理解复杂时间关系方面仍面临显著挑战,而测试时扩展技术可明显提升时间逻辑推理能力。