2012年的云服務中斷屢屢讓提供商們尷尬不已,可以說宕機事件既數偶然,也數必然,云服務廠商在云道路上需要不斷的摸索與前進。
微軟Windows Azure兩次出事
2月28日,由于“閏年bug”導致微軟Azure在全球范圍內大面積服務中斷,中斷時間超過24小時。雖然微軟表示該軟件BUG是由于閏年時間計算不正確導致,但這一事件激起了許多用戶的強烈反應,許多人要求微軟為此做出更合理詳細的解釋。
7月26日,Azure再次故障,導致西歐用戶受影響。微軟對故障的解釋是“由于錯誤配置了網絡設備導致了西歐區域的服務網絡中斷”。此次中斷持續2.5小時。微軟表示此次事故中并無用戶數據丟失。
AWS真該升級數據中心了
6月15日,亞馬遜北維吉尼亞的數據中心遭遇停電,由此導致亞馬遜網絡服務AWS中斷約6個小時,影響波及亞馬遜彈性計算EC2、亞馬遜關系數據庫服務以及亞馬遜彈性魔豆AWS Elastic Beanstalk。北維吉尼亞數據中心是亞馬遜使用最久的數據中心,在2011年以及今年10月都曾發生過宕機事故,導致用戶信心流失不少。
“我很喜歡亞馬遜,但是宕機的時候也真是無能為力,盡管我也知道傳統IT數據中心也會遇到這種情況”,Stratalux公司CEO Jeremy說。中斷事故導致了他的一位客戶服務中斷了1個小時。
10月22日,位于北維吉尼亞的亞馬遜網絡服務AWS又掛了,影響了包括Reddit、Pinterest等知名大網站。中斷影響了彈性魔豆服務,其后是彈性魔豆服務的控制臺,關系數據庫服務,彈性緩存,彈性計算云EC2,以及云搜索。這次事故讓很多人認為,亞馬遜是應該升級其北維尼吉亞數據中心的基礎設施了。
Google 也沒能幸免
在微軟Azure宕機的同一天,Google Gmail用戶使用的Gtalk中斷了近5小時。Gtalk服務的控制面板頁為用戶提供了因服務中斷所導致的升級。Google對此也做出了道歉“請相信 google是極度重視系統可靠性的,我們會更加注意提升我們系統的性能”。
GAE是用于開發和托管WEB應用程序的平臺,數據中心由google管理,中斷時間是10月26日,持續4小時,因為突然變得反應緩慢,而且出錯。受此影響,50%的GAE請求均失敗。google表示沒有數據丟失,應用程序行為也有備份可以還原。google表示他們正在加強其網絡服務以應對網絡延遲問題,“我們已經增強了流量路由能力,并調整了配置,這些將會有效防止此類問題再次發生”。
Dropbox欠解釋
同是10月26日,在線存儲公司Dropbox也發生服務中斷。當時網站顯示錯誤信息“抱歉,網站出問題了,不過請勿擔心,數據都很安全,我們也在盡快修復。”此后他們也并未做出進一步的解釋。