11月12日,就在“双十一”后的第二天,“阿里云盘崩了”的消息一度冲上微博热搜,连同冲上热搜的还有诸如淘宝、闲鱼、钉钉等阿里云支持下的其他阿里官方产品。
据阿里云官方公告显示,此次阿里云故障发生在11月12日下午17:44左右,受到影响的产品包括OSS、OTS、SLS、MNS等多款产品,波及地区涵盖北京、上海、深圳等国内众多一二线城市,以及日韩、美国、德国等海外地区。
经过阿里云工程师紧急抢修,在经历了一个多小时的异常后,杭州、北京等地控制台和API服务陆续回复;经过三个多小时的抢修后,官方表示,受到影响的云产品在21:11均已恢复。
就在阿里云相关业务故障后不久,这一事件一度冲上了微博热搜,而这次业务故障,或将成为阿里云至今波及面最广的云服务故障。
有知乎网友表示,“自己正看着比赛,公司给我打电话说服务器502上不去了,一看钉钉群全是健康检查异常告警推送,连忙上阿里云控制台看看啥情况,结果发现控制台都登不上去,oss啥的也都进不去。”
也有知乎网友认为,这可能是受到了大公司“降本增效的影响”。
至于这次阿里云故障更深层次的影响,有业内人士指出,“由于DNS控制台也发生了故障,用户连切换流量的机会都没有了,用户只能等阿里云自己修复。”
也有业内人士告诉至顶网,”这个事件确实给了我们一个教训是‘鸡蛋不要放到一个篮子里’,关键业务还是要多云、多数据中心部署,“不过,他也指出,”如此一来,成本肯定会提升,同时备案也是个比较麻烦的事情,所以还是需要企业根据自己情况来抉择。“
实际上,这样的云服务全球故障在今年并非首例,就在上周OpenAI DevDay发布会后,OpenAI也发生了大规模宕机。
彼时,OpenAI CEO奥特曼亲自出面道歉称:
“大家对新功能的热情远超我们预期,我们原计划本周一为所有订阅者提供GPTs,但现在(周二)仍然没能实现,我们希望这个进度可以加快。
由于负载的原因,短期内我们的服务可能出现不稳定的情况,对不起。”
与此同时,海外云厂商在今年也接连宕机,外加互联网厂商对云服务成本的长期考量,让整个行业逆流迎来了一波“下云潮“。
Ruby on Rails之父David Heinemeier Hansson在今年9月发布的一篇名为《Our cloud exit has already yielded m/year in savings》的文章中就曾指出,“‘下云’为我们节省的费用已经一路攀升到了每年200万美元左右,五年内将达到1000万美元。”
而像David Heinemeier Hansson一样,通过购买服务器,自己在本地搭建私有云的方式取代以往购买公有云服务的方案,在国外已经形成了一股新的潮流。
数字化是当代企业转型的大势所趋,然而,在接下来企业数字化转型过程中,基于对安全性和成本的双重考量,私有云、多云、混合云也将成为更多企业需要认真考虑的数字化方案。
好文章,需要你的鼓励
在我们的日常生活中,睡眠的重要性不言而喻。一个晚上没睡好,第二天的工作效率就会大打折扣,而充足的睡眠不仅能让我们恢复精力,还能帮助大脑整理和巩固当天学到的知识。有趣的是,AI模型竟然也表现出了类似的“睡眠需求”。
DeepSeek-AI团队通过创新的软硬件协同设计,仅用2048张GPU训练出性能卓越的DeepSeek-V3大语言模型,挑战了AI训练需要海量资源的传统观念。该研究采用多头潜在注意力、专家混合架构、FP8低精度训练等技术,大幅提升内存效率和计算性能,为AI技术的民主化和可持续发展提供了新思路。
尽管模型上下文协议(MCP)自11月推出以来用户数量快速增长,但金融机构等监管行业仍保持谨慎态度。银行等金融服务公司虽然在机器学习和算法方面是先驱,但对于MCP和Agent2Agent(A2A)系统的采用较为保守。监管企业通常只使用内部代理,因为其API集成需要经过多年审查以确保合规性和安全性。专家指出,MCP缺乏基本构建块,特别是在互操作性、通信标准、身份验证和审计跟踪方面。金融机构需要确保代理能够进行"了解您的客户"验证,并具备可验证的身份识别能力。
加拿大女王大学研究团队首次系统评估了大型视频语言模型的因果推理能力,发现即使最先进的AI在理解视频中事件因果关系方面表现极差,大多数模型准确率甚至低于随机猜测。研究创建了全球首个视频因果推理基准VCRBench,并提出了识别-推理分解法(RRD),通过任务分解显著提升了AI性能,最高改善幅度达25.2%。