ZD至顶网软件频道消息:所有云都停机了。但是当你主导市场的时候,你会受到更多的关注。
上周二,美国弗吉尼亚州AWS数据中心的一个认为错误导致了大规模的服务中断,这是4年以来遭遇的最大一次公有云中断。不断是否是AWS的问题,考虑到AWS有庞大的客户群,以及使用AWS作为平台的服务提供商为数众多,所以更加放大了这次服务中断的影响。
这样的情况在AWS早期开拓市场的时候并不少见。每年发生两次或者三次大事件是常态,但是现在情况不一样了。
尽管如此,考虑到最近的故障以及它遭受的审查风暴,我们决定对过去进行一次总结,看看哪些事件是AWS最不堪回首的。
风暴席卷:2016年6月
2016年6月悉尼遭遇风暴,AWS在该地区的设施停电,很多EC2实例以及为一些知名公司托管关键负载的EBS卷接连出现故障。在那个周末,澳大利亚AWS可用区域的网站和在线服务中断了近10个小时,使得从银行服务到披萨送货都出现了问题。
DNS拒绝:2014年11月
2014年11月AWS的CloudFront DNS服务出现近2个小时的中断。一些网站和云服务出现脱机,因为在故障期间内容交付网络无法满足DNS请求。
黑色星期五:2013年9月
2013年9月13日黑色星期五发生的这次故障是由负载均衡问题所导致的,部分地区客户受到影响。Amaozn解决了复杂均衡的接入问题,并增加了配置时间以防止后续这种问题的出现。虽然这次中断只持续了大约2个小时且只影响到弗吉尼亚州的一个可用区域,但对Amazon来说,却是一个要制定备份计划的重要提醒。
圣诞节:2012年12月
AWS在2012年的圣诞前夜遭遇服务中断,这使得Netflix无法在这个在线电影交付最繁忙的时候正常运转。这家知名客户因为这次不幸指责Amazon,成为这次事件的一个持久回忆。
背靠背:2012年6月
2012年6月,Amazon位于弗吉尼亚的数据中心出现服务中断,导致运营停止约6个小时,影响到几十家客户。10月22日,弗吉尼亚数据中心的另一个问题导致很多客户的网站无法正常运行。两次相继发生的中断事件使得很多企业领导者对采用云感到不安,当时云这个理念刚刚在企业中开始被接受。
黑暗后的沉默:2011年4月
这是2011年的首次中断事件,引起了人们对云有时候很脆弱的关注,并且说明,随着事情的进展沟通是最关键的。Amazon最大的一些客户甚至离线数天时间。
当客户正在努力恢复运行的时候,云计算巨头Amazon却一直沉默。一个星期过去了,Amazon才发布了关于这次事故一个非常技术的、冗长的文章。Amazon归咎于“重新镜像风暴”,并向客户道歉。这次事件被很多人看作是如果不处理服务中断事故会受到怎样的教训。
好文章,需要你的鼓励
英特尔第三季度财报超华尔街预期,净收入达41亿美元。公司通过裁员等成本削减措施及软银、英伟达和美国政府的大额投资实现复苏。第三季度资产负债表增加200亿美元,营收增长至137亿美元。尽管财务表现强劲,但代工业务的未来发展策略仍不明朗,该业务一直表现不佳且面临政府投资条件限制。
美国认知科学研究院团队首次成功将进化策略扩展到数十亿参数的大语言模型微调,在多项测试中全面超越传统强化学习方法。该技术仅需20%的训练样本就能达到同等效果,且表现更稳定,为AI训练开辟了全新路径。
微软发布新版Copilot人工智能助手,支持最多32人同时参与聊天会话的Groups功能,并新增连接器可访问OneDrive、Outlook、Gmail等多项服务。助手记忆功能得到增强,可保存用户信息供未来使用。界面新增名为Mico的AI角色,并提供"真实对话"模式生成更机智回应。医疗研究功能也得到改进,可基于哈佛健康等可靠来源提供答案。同时推出内置于Edge浏览器的Copilot Actions功能,可自动执行退订邮件、预订餐厅等任务。
纽约大学等机构联合开发的ThermalGen系统能够将普通彩色照片智能转换为对应的热成像图片,解决了热成像数据稀缺昂贵的难题。该系统采用创新的流匹配生成模型和风格解耦机制,能适应从卫星到地面的多种拍摄场景,在各类测试中表现优异。研究团队还贡献了三个大规模新数据集,并计划开源全部技术资源,为搜救、建筑检测、自动驾驶等领域提供强有力的技术支撑。