|
亚马逊平安夜宕机细节:负载均衡出错2012年圣诞夜(12月24日)专门提供视频流的Netflix服务中断了近20小时,并说明是因Amazon云(AWS)故障而造成的影响,Amazon随后出面解释,因负载均衡服务(Amazon Elastic Load Balancing Service,ELB)的数据误删除引起的。 据国外媒体消息,2012年圣诞夜(12月24日)专门提供视频流的Netflix服务中断了近20小时,并说明是因Amazon云(AWS)故障而造成的影响,Amazon随后出面解释,因负载均衡服务(Amazon Elastic Load Balancing Service,ELB)的数据误删除引起的。 Amazon ELB从故障到完全恢复的时间为2012年12月24日的中午12点24分到12月25日的12点05分。Amazon说明,该站的开发人员在进行维护时不小心删除了ELB上的状态数据,这些数据是用来管理美国东部的负载均衡器,但当时没未发现,一直到ELB控制盘在呼叫API来管理负载均衡器时不断出现延迟及错误提示才得知,且只有少数的ELB负载均衡器受到影响。 一开始Amazon并未发现出错的原因,而以为是API错误,随后AWS的客户才提交他们在更改负载均衡的设定后性能出现问题,Amazon才发现症结,并回复遗失的ELB数据。 Amazon表示,在最高峰的时候,只有6.8%使用负载均衡器的服务受到影响,因为其他的负载均衡器无法由客户自行扩展或修改而未受波及,AWS团队先进行手动回复受到影响的负载均衡器,随后装回移失的ELB数据。 除了道歉外Amazon给出补救措施,包括提出更严谨的规定以降低ELB状态数据被误删的风险,由此次的经验修改数据恢复流程加快数据恢复速度。 责编:杨雪姣 微信扫一扫实时了解行业动态 微信扫一扫分享本文给好友 著作权声明:畅享网文章著作权分属畅享网、网友和合作伙伴,部分非原创文章作者信息可能有所缺失,如需补充或修改请与我们联系,工作人员会在1个工作日内配合处理。 |
最新专题 推荐圈子 |
|