11月12日,就在“双十一”后的第二天,“阿里云盘崩了”的消息一度冲上微博热搜,连同冲上热搜的还有诸如淘宝、闲鱼、钉钉等阿里云支持下的其他阿里官方产品。
据阿里云官方公告显示,此次阿里云故障发生在11月12日下午17:44左右,受到影响的产品包括OSS、OTS、SLS、MNS等多款产品,波及地区涵盖北京、上海、深圳等国内众多一二线城市,以及日韩、美国、德国等海外地区。
经过阿里云工程师紧急抢修,在经历了一个多小时的异常后,杭州、北京等地控制台和API服务陆续回复;经过三个多小时的抢修后,官方表示,受到影响的云产品在21:11均已恢复。
就在阿里云相关业务故障后不久,这一事件一度冲上了微博热搜,而这次业务故障,或将成为阿里云至今波及面最广的云服务故障。
有知乎网友表示,“自己正看着比赛,公司给我打电话说服务器502上不去了,一看钉钉群全是健康检查异常告警推送,连忙上阿里云控制台看看啥情况,结果发现控制台都登不上去,oss啥的也都进不去。”
也有知乎网友认为,这可能是受到了大公司“降本增效的影响”。
至于这次阿里云故障更深层次的影响,有业内人士指出,“由于DNS控制台也发生了故障,用户连切换流量的机会都没有了,用户只能等阿里云自己修复。”
也有业内人士告诉至顶网,”这个事件确实给了我们一个教训是‘鸡蛋不要放到一个篮子里’,关键业务还是要多云、多数据中心部署,“不过,他也指出,”如此一来,成本肯定会提升,同时备案也是个比较麻烦的事情,所以还是需要企业根据自己情况来抉择。“
实际上,这样的云服务全球故障在今年并非首例,就在上周OpenAI DevDay发布会后,OpenAI也发生了大规模宕机。
彼时,OpenAI CEO奥特曼亲自出面道歉称:
“大家对新功能的热情远超我们预期,我们原计划本周一为所有订阅者提供GPTs,但现在(周二)仍然没能实现,我们希望这个进度可以加快。
由于负载的原因,短期内我们的服务可能出现不稳定的情况,对不起。”
与此同时,海外云厂商在今年也接连宕机,外加互联网厂商对云服务成本的长期考量,让整个行业逆流迎来了一波“下云潮“。
Ruby on Rails之父David Heinemeier Hansson在今年9月发布的一篇名为《Our cloud exit has already yielded m/year in savings》的文章中就曾指出,“‘下云’为我们节省的费用已经一路攀升到了每年200万美元左右,五年内将达到1000万美元。”
而像David Heinemeier Hansson一样,通过购买服务器,自己在本地搭建私有云的方式取代以往购买公有云服务的方案,在国外已经形成了一股新的潮流。
数字化是当代企业转型的大势所趋,然而,在接下来企业数字化转型过程中,基于对安全性和成本的双重考量,私有云、多云、混合云也将成为更多企业需要认真考虑的数字化方案。
好文章,需要你的鼓励
两家公司在OverdriveAI峰会上分享了AI应用经验。Verizon拥有超过1000个AI模型,用于预测客户呼叫原因和提供个性化服务,将AI推向边缘计算。Collectors则利用AI识别收藏品真伪,将每张卡片的鉴定时间从7分钟缩短至7秒,估值从8.5亿美元增长至43亿美元。
阿布扎比科技创新研究院团队首次发现大语言模型生成的JavaScript代码具有独特"指纹"特征,开发出能够准确识别代码AI来源的系统。研究创建了包含25万代码样本的大规模数据集,涵盖20个不同AI模型,识别准确率在5类任务中达到95.8%,即使代码经过混淆处理仍保持85%以上准确率,为网络安全、教育评估和软件取证提供重要技术支持。
Hammerspace发布v5.2数据平台软件,通过更快的元数据读取、更好的数据放置和扩展性优化提升AI数据访问性能。新版本IO500总分提升33.7%,总带宽翻倍,IOR-Hard-Read测试提升超800%。增加了Tier 0亲和性功能,支持GPU服务器本地存储访问,减少集群内网络流量。新增Oracle云支持、Kerberos认证和标签化NFS,提供更细粒度的访问控制。该软件将于12月正式发布。
斯坦福大学研究团队首次系统比较了人类与AI在文本理解任务中的表现。通过HUME评估框架测试16个任务发现:人类平均77.6%,最佳AI为80.1%,排名第4。人类在非英语文化理解任务中显著优于AI,而AI在信息处理任务中更出色。研究揭示了当前AI评估体系的缺陷,指出AI的高分往往出现在任务标准模糊的情况下。