怎樣最小化雲宕機事件的影響?

怎樣最小化雲宕機事件的影響?

來自專欄 SEO

雲計算並不是天生就是不可靠的,但是如同所有的IT形式一樣,必須仔細挑選和管理雲服務以實現特定的可靠性和可用性目標。這些步驟可以是合同形式的、是技術形式的或者甚至可能需要重新思考你的應用程序架構。如果沒有經過慎重考慮,那麼你從雲計算中的收益可能要少於你的預期。

SLA降低了使用雲廠商數據中心而產生的風險

免受雲宕機事件影響的第一步就是要評估雲廠商數據中心的可靠性。大部分的雲廠商都擁有著很少數量的數據中心,通常情況下只有一個,而這些數據中心易於產生與企業相同類型的故障。最廣為人知的雲計算故障往往是那些整個雲計算數據中心發生故障的事件,通常都是由於自然災害而發生的故障。為了在有可能發生的故障中保護好你自己,你必須要求特定的數據中心配置信息或從你的供應商那裡獲得可用性保證。

對於伺服器、存儲設備和網路的可用性,最好的策略是在談判時就確定SLA,以便於指定可用性保證和發生故障時恢復服務的時間。用戶應當了解在雲計算數據中心所在的區域是否會經常發生諸如颶風或暴風雪這樣的災害性天氣,這一點是非常重要。同時,還應確定數據中心是否配有備用電源,是否配有一個能夠接替正常工作的備用數據中心。

備份數據中心必須位於不同於主數據中心的另一區域,所以它就不會受到相同問題的影響,同時它還必須擁有足夠的容量以處理雲應用的故障轉移。由於很少有供應商能夠為主數據中心的100%故障轉移提供足夠的備份數據中心容量,所以SLA將說明如何管理故障轉移。

在這種情況下,為優先順序支付費用可能是必要的。如果你的雲服務包括了地理多樣性以支持分散式的用戶群體,那麼你自己的各種設施就可以為雲廠商故障提供某些保護措施;仔細檢查你的合同以確保有足夠的容量來處理額外的負載。

網路性能問題或缺少將導致雲宕機事件

雲計算故障的最常見原因通常並不是雲計算,而是網路。大部分的雲應用都是通過互聯網進行訪問的,而互聯網可用性則是大多數雲宕機事件的罪魁禍首。解決這個問題的唯一方法就是採用虛擬私有網路(VPN)或虛擬區域網服務,或確保同時讓多個互聯網服務供應商(ISP)提供服務以供網站訪問雲應用使用。如果安全性和合規性問題可以得到解決,並得到供應商的合同確認,那麼這是一個很不錯的選擇。

作為雲服務的使用者,很多用戶對雲服務的了解僅僅只是停留在對服務、技術的選擇和應用層面上,對雲端壞境的整體構建、數據安全等不甚了解,因而捍衛數據安全則成為了雲提供商的主要任務之一。

經過三年的不斷發展,小鳥雲在數據安全所作的努力已得到了顯著的效果。小鳥雲通過協助用戶對自身的雲端數據進行把存儲管理以及安全把控等手段,為用戶制定了一個可靠的數據管理策略。

首先,小鳥雲計算十分注重數據的安全防護措施。在數據安全防護措施方面,小鳥云為數據建立和採用符合國際標準的防護技術。採用基於文件分塊的完全副本冗餘方式(冗餘2份,副本3份),提高數據存儲持久性。

其次,小鳥雲計算也十分注重對數據的隱私的保護。小鳥雲在數據隱私方面採用的是HTTPS安全加密傳輸協議,內網通信採用高強度國際加密標準,防止數據被竊取,維護數據的安全及完整性;同時小鳥雲具有具有完善且嚴苛的用戶數據保密制度及措施,並承諾在任何情況下絕不會將用戶數據泄露給第三方。

最後,小鳥雲計算也格外注重建立完善的防攻擊體系。比如,小鳥云為旗下雲產品提供5G-20G免費的DDoS攻擊流量清洗,通過專業的DDoS防護設備來為用戶互聯網應用提供精細化的抵禦DDOS攻擊能力,如UDP Flood攻擊、SYN Flood攻擊和CC攻擊等。

必須解決雲應用的彈性問題

如果雲計算數據中心和雲計算網路故障問題都已解決,那麼下一個問題就是應用程序本身的彈性問題了。管理高可用性和雲服務的最大問題都涉及資料庫訪問和可靠的事務處理。

如果一個數據中心發生故障,即便另一個備用數據中心能夠備份使用這些數據的應用程序,在數據中心中所存儲的數據都是不可用的。除非是在多個位置的「熱待機」狀態維護應用程序數據,否則一次故障都將導致數據訪問丟失,從而使其它冗餘措施都大部分實效。這個問題同樣也存在於內部數據中心備份,因此那些為他們自己數據中心提供冗餘的企業會發現相同的措施在雲計算中也會同樣有效。與其說這是個技術策略還不如說這是個金融策略;由於雲計算存儲和服務費用的原因,在雲計算中維護冗餘數據的成本要更高。一個更好的解決方案是把你所有的內部數據都布署在一個高可用性的受保護數據中心中,並從多個雲計算位置進行訪問。

最好的可用性管理必須是與應用程序本身集成。任何時候,資料庫更新都是對多個副本同時進行的,如果在更新過程中發生了故障,那麼數據完整性就存在著丟失的風險。聯機事務處理系統通常包括一個「兩階段提交」的過程以確保不會由於無法成功更新所有資料庫副本而發生問題。有時,單個資料庫的更新也會因為網路故障而處於一個不確定的狀態。有必要審查專為確保網路故障或數據中心故障而開發的應用程序,從而確保所存儲的資料庫不會發生數據受損或不一致的風險。

期望雲應用能夠具有比內部應用相同或更高的可靠性是不合理的。此外,你所設定的可靠性和特定目標可能會讓你花費很多。當構建你的業務案例時,請記得考慮可靠性成本,或者你可能會發現你的應用程序必須在可靠性和成本之間作出某種妥協。


推薦閱讀:

TAG:宕機 | 伺服器 | 科技 |