11月12日,就在“双十一”后的第二天,“阿里云盘崩了”的消息一度冲上微博热搜,连同冲上热搜的还有诸如淘宝、闲鱼、钉钉等阿里云支持下的其他阿里官方产品。
据阿里云官方公告显示,此次阿里云故障发生在11月12日下午17:44左右,受到影响的产品包括OSS、OTS、SLS、MNS等多款产品,波及地区涵盖北京、上海、深圳等国内众多一二线城市,以及日韩、美国、德国等海外地区。
经过阿里云工程师紧急抢修,在经历了一个多小时的异常后,杭州、北京等地控制台和API服务陆续回复;经过三个多小时的抢修后,官方表示,受到影响的云产品在21:11均已恢复。
就在阿里云相关业务故障后不久,这一事件一度冲上了微博热搜,而这次业务故障,或将成为阿里云至今波及面最广的云服务故障。
有知乎网友表示,“自己正看着比赛,公司给我打电话说服务器502上不去了,一看钉钉群全是健康检查异常告警推送,连忙上阿里云控制台看看啥情况,结果发现控制台都登不上去,oss啥的也都进不去。”
也有知乎网友认为,这可能是受到了大公司“降本增效的影响”。
至于这次阿里云故障更深层次的影响,有业内人士指出,“由于DNS控制台也发生了故障,用户连切换流量的机会都没有了,用户只能等阿里云自己修复。”
也有业内人士告诉至顶网,”这个事件确实给了我们一个教训是‘鸡蛋不要放到一个篮子里’,关键业务还是要多云、多数据中心部署,“不过,他也指出,”如此一来,成本肯定会提升,同时备案也是个比较麻烦的事情,所以还是需要企业根据自己情况来抉择。“
实际上,这样的云服务全球故障在今年并非首例,就在上周OpenAI DevDay发布会后,OpenAI也发生了大规模宕机。
彼时,OpenAI CEO奥特曼亲自出面道歉称:
“大家对新功能的热情远超我们预期,我们原计划本周一为所有订阅者提供GPTs,但现在(周二)仍然没能实现,我们希望这个进度可以加快。
由于负载的原因,短期内我们的服务可能出现不稳定的情况,对不起。”
与此同时,海外云厂商在今年也接连宕机,外加互联网厂商对云服务成本的长期考量,让整个行业逆流迎来了一波“下云潮“。
Ruby on Rails之父David Heinemeier Hansson在今年9月发布的一篇名为《Our cloud exit has already yielded m/year in savings》的文章中就曾指出,“‘下云’为我们节省的费用已经一路攀升到了每年200万美元左右,五年内将达到1000万美元。”
而像David Heinemeier Hansson一样,通过购买服务器,自己在本地搭建私有云的方式取代以往购买公有云服务的方案,在国外已经形成了一股新的潮流。
数字化是当代企业转型的大势所趋,然而,在接下来企业数字化转型过程中,基于对安全性和成本的双重考量,私有云、多云、混合云也将成为更多企业需要认真考虑的数字化方案。
好文章,需要你的鼓励
Y Combinator合伙人Ankit Gupta与Anthropic预训练负责人Nick Joseph最近进行了一次深度对话。
微软研究院提出潜在分区网络(LZN),首次实现生成建模、表示学习和分类任务的真正统一。该框架通过共享高斯潜在空间和创新的潜在对齐机制,让原本独立的AI任务协同工作。实验显示LZN不仅能增强现有模型性能,还能独立完成各类任务,多任务联合训练效果更是超越单独训练。这项研究为构建下一代通用AI系统提供了新的架构思路。
9月13日的PEC 2025 AI创新者大会暨第二届提示工程峰会上,“年度提问二:新工作时代:AI工作流由谁主导?”从企业实践到技术实现、从业务落地到战略决策,展开了一场高密度的思想碰撞与经验分享,将AI工作流背后的难题和解决路径彻底揭开。
上海AI实验室开发的VLAC模型让机器人首次具备真实世界自主学习能力。该系统如同给机器人配备智能导师,能实时评估动作效果并从中学习。在四个操作任务测试中,机器人成功率从30%提升至90%,仅需200次练习。技术结合视觉、语言理解和动作生成,支持跨场景适应和人机协作,为家庭服务、医疗护理等领域应用奠定基础。