新商业：
CIO
人物 CIO加油站云计算大数据 Apps 10Things 企业开源智库
CXO
创新创业
数字化转型
新工业
金融科技
市场调研
行业会议
最新文章

科技行者 行者学院转型私董会科技行者专题报道网红大战科技行者: 知识库
知识库安全导航

至顶网›软件频道 ›产业观察›2015年十大云故障盘点：永远没有完美的云

2015年十大云故障盘点：永远没有完美的云

扫一扫
分享文章到微信
扫一扫
关注官方公众号
至顶头条

没有哪家供应商是完美的，但是那些托管着全球工作负载的提供商确实应该接受更严格的审查，这也是为什么像AWS、微软、谷歌和苹果这样的技术巨头在这个榜单上如此突出的原因。

来源：ZD至顶网软件频道2015-12-28 10:24:50

关键字：微软Azure AWS 云计算

ZD至顶网软件频道消息：云中正在发生一种矛盾的情况——虽然中断故障已不那么普遍，但是影响却比以往更加广泛且更有破坏性。

随着云技术的成熟，提供商获得更多运营的经验，正常运行时间不断增加，并且不可避免地还会继续下去。

正是这种朝着更高可靠性迈进的不断累积且稳定的过程，给予企业、政府和学术机构将关键任务工作负载迁移到云中的信心。

这就是为什么尽管一些中断故障不如前几年发生得那么具有灾难性，但是却带来更多问题的原因。因为更多人开始信赖云、拥抱云、信任云。

没有哪家供应商是完美的，但是那些托管着全球工作负载的提供商确实应该接受更严格的审查，这也是为什么像AWS、微软、谷歌和苹果这样的技术巨头在这个榜单上如此突出的原因。

Verizon云，1月10日和11日

虽然云服务提供商最担心的是长时间停电，但是Verizon通信公司震惊了客户，他们计划让自己的云在整个周末长达40个小时的时间内离线，以实时全面地进行系统维护。

然而讽刺的是，Verizon升级自己云基础设施的一个原因是防止未来的停机。

很多客户都对自己的提供商故意削减他们的云服务感到气恼，但也有人安慰说，Verizon花费这40个小时无缝升级了可能未来让他们在实时系统上不中断运行的情况下就进行升级、甚至是不需要重启服务器的能力。

Google Compute Engine，2月18日和2月19日

就在午夜前，多个谷歌IaaS数据中心宕机，经过大约一小时的停机，最受影响的客户服务在第二天凌晨一点恢复。

一些连接问题持续了近三个小时，其中大约40分钟的时间内，本该由谷歌虚拟机传送的数据消失在了风中。

谷歌认为这个问题是“不可接受”的，并向受影响的用户道歉。

大约三个星期后类似事件再次发生，谷歌的IaaS同样出现问题，导致一些用户失去了长达45分钟的服务响应。

Apple iCloud，3月11日

在将近12个小时内，全球数百万人无法购买数字音乐、书籍或者是应用。所幸的是，他们大多数没有受到影响。

苹果在向用户致歉中将一个内部DNS错误归结为使iTunes和App Store服务中断的原因。一些iCloud电子邮件帐户也受到了短暂的影响。

微软Azure，3月16日

微软的两项Azure公有云服务在美国中部的客户中中断了2个多小时，微软将其归结为“网络基础设施问题”。

根据微软在Azure状态网页上的报告，这次瘫痪事件发生在CDT时间下午1点刚过，影响到微软Azure虚拟机（基础设施即服务）和Azure云服务（平台即服务）产品的客户。

微软将该问题描述为“部分服务中断”，并表示该服务已经在CT时间3:19完全恢复可用。

微软Azure，3月17日

在第二次故障发生之前，微软公有云甚至都没有撑过24小时，就中断了虚拟机、网站和其他云服务，这次影响到美国东海岸更密集的客户群。

微软在Azure状态页面上报告，这次故障从EDT时间下午1:30开始。作为全球第二大公有云提供商，微软向客户通知称这次服务中断是源自于存储系统发生的故障。

Apple iCloud，5月20日

包括电子邮件在内的11项苹果服务遭遇了11个小时的中断。其中一些完全瘫痪，其他的则运行非常非常缓慢。

中断的服务包括iCloud Drive、Photos、Documents、Find My iPhone、Back to My Mac、iCloud Backup、iCloud Keychain、iCloud Mail、iMovie Theater以及iWork for iCloud Beta。

根据苹果的系统状态页面，全球5亿的iCloud用户中有40%受到了影响。

AWS，8月10日

AWS是全球最大的公有云提供商，它在8月10日早晨遭遇了罕见的瘫痪，服务中断导致很多热门网站中断。

这次故障的根源似乎是弗吉尼亚州北部的一个AWS数据中心，AWS状态页面上罗列出该数据中心发生的一系列错误。

Amazon报告称，在PDT时间清晨12:08到3:40，Elastic Compute Cloud、EC2“错误率升高”，Simple Storage Service（S3）出现“错误增加”。

合作伙伴在Twtter上表示，这两项AWS服务的很多客户在这段时间内陷入困境。

Google Compute Engine，8月13日到8月17日

在比利时的一个周四早上，谷歌靠近St. Ghislain的一座超高能效数据中心遭遇4次闪电袭击。

这次雷暴导致一系列技术故障，最终造成一些I/O错误。

据谷歌称，只有很小一部分保存着Google Compute Engine实例的磁盘上出现了数据丢失。

虽然谷歌表示所有数据最终都找回并恢复，但数据中心理应让服务器和客户数据能够应对像这次闪电造成的高压脉冲。

在这种情况下，要责怪的只能是这个超高能效架构遭受的史诗般的雷暴了。

Google Compute Engine，11月23日

谷歌的网络引擎试图激活一个指向欧洲运营商的链接，但是对方网络处于处理路由一个令人惊讶的高流量，但事实并非如此。

这条线路快速饱和，连接网络丢掉了大多数从受影响的西欧数据中心路由到东欧和中东的数据包。

Google Compute Engine无法与这些地区进行通信长达70分钟，从PST时间上午11:55到下午1:05。

据谷歌称，在该故障发生期间，该季度的流量减少了13%。

微软Office 365，12月6日

微软Azure基础设施内发生的一次故障，导致下午大部分时间西欧的Office 365服务都处于瘫痪状态。

很多用户，多数是来自于英国，无法收到电子邮件、文档以及其他被微软云生产力工具所使用的文件。有些还遭遇了长达4个小时的间歇性问题。

微软随后表示，是Active Directory配置错误导致了这次瘫痪。

VIP用户

普通用户

邮件订阅

如果您非常迫切的想了解IT领域最新产品与技术信息，那么订阅至顶网技术邮件将是您的最佳途径之一。

重磅专题

相关文章

最新文章

业界热点:

数字化转型东数西算自动驾驶智能制造云计算元宇宙虚拟人物联网算力网络数字孪生人工智能区块链开源大数据

北京第二十六维信息技术有限公司（至顶网）版权所有. 京ICP备15039648号-7 京ICP证161336号

京公网安备 11010802021500号