海雲捷迅的教育雲實戰經驗分享

在互聯網時代,大數據、雲計算、移動化、社交網路、物聯網等新技術層出不窮,對教育信息化應用也產生了重大影響,大數據學習分析、教育雲、HPC、移動教育等應用逐漸成為教育行業的熱點。

然而,教育系統對於信息化的認識仍然離互聯網時代的創新還有很大差距,特別是校園網路一般基於傳統 IP 技術,僅僅只是對校園信息化起支撐作用,這是遠遠不夠的。

以 OpenStack 為代表的雲計算等新技術的深入應用,將實現優質資源的整合與共享。資源的整合與共享一直以來都是教育信息化的主旨,雲計算從技術優勢上提供了全方位資源運用、共享管理的基礎環境。

雲計算數據中心的構建使得教育主體更加專註於教育業務本身,減少信息系統選擇、規劃、建設等工作;雲計算跨平台環境使得複雜的設備管理變得統一簡單,個性化、異構的信息系統需求得以保證,知識的產生、加工、傳輸、緩存數據安全更具保障。

未來,教育信息化領域的大容量資源調度管理、網路設備運營管理、大規模伺服器資源統一管理提出了全新的要求,以雲計算、OpenStack 為基礎的大規模雲管理平台、PB 級雲存儲的管理應用將成為各級別學校信息中心進行 IT 建設的實施重點。

海雲捷迅結合我國教育系統信息化所面臨的挑戰,通過多年在各學校內的實踐積累並整合了現有 OpenStack 雲計算架構的功能模型,針對我國教育系統開發了教育雲解決方案,可為高等院校和區域內初中等教育機構及相關方的業務需求提供雲化支撐。

海雲捷迅武漢大學案例

1. 項目背景

在教育信息化平台建設中,武漢大學在基礎設施的建設、軟硬體設備的購置上,投入了大量的人力財力,在一定程度上促進了教育資源共享,提高了信息化教學環境和管理水平。而隨著武漢大學教學改革的深入,越來越重視學生的個性化需求。完全學分制、創新教育、網路公開課等新的管理和教學形式的引入,對武漢大學的教育信息化平台建設提出了新的要求。「互聯網+」的提出,雲計算、大數據、移動計算等技術的出現,為解決此問題提供了新的技術途徑和模式,雲計算又是其中的核心和基礎。

雲計算的一個重要特點就是面向服務。雲計算安全聯盟(Cloud Security Alliance)曾指出了雲計算的本質,雲計算是一種服務提供模型,通過該模型用戶可不受時空的限制,根據自身需要,通過網路選擇資源池中的共享資源;同時這些資源的分配是動態的和彈性的,可以在不同用戶之間靈活劃分。

2. 項目需求

目前,武漢大學教育信息化平台建設取得了長足的進展。校園網、在線教育平台的普及等,提高了教育資源的共享和利用率,促進了高校管理手段和教學方式的變革。但這其中暴露出的一些問題也不容忽視,關係著武漢大學教育信息化平台的可持續發展。

一、軟硬體設施分散,管理維護成本高

武漢大學的各二級院系在信息化平台的建設中,一般會自購硬體設備和相應的教學軟體,比如伺服器、在線教學平台等。為了保證兼容性和穩定性,一台伺服器上通常只運行 1 到 2 個應用,硬體資源的利用率不高。有些教學軟體在功能上具有通用性,但僅供院系內部使用,軟體資源的共享性也不足。同時,機房為了滿足不同的教學需求,在每台機器上都安裝了大量的軟體。為了維護軟硬體資源的正常運行,每個院系都需要安排專門的人員進行管理,工作量較大,效率較低。

二、 信息化教學資源日新月異,現有設施更新速度慢

隨著信息化教學的深入開展,數字化學習資源越來越豐富。網路公開課、微課等教學模式的湧現,對於軟硬體水平提出了更高的要求。比如在網路公開課建設和運行中,會存儲大量的教學視頻和各類學習資源,學習者對伺服器會產生大規模的並發數據訪問,網路公開課平台會實時動態生成大量的學習和統計數據。

這就需要伺服器等硬體設施具備更高數據處理能力,網路設備具備較高的數據吞吐量等。而二級院系現有的設備,通常已經運行多年,由於當初設計和自然損耗等原因,已不能跟上最新的需求。若獨自更新相關軟硬體,則需經歷新一段規劃與建設周期,耗時較長。

三、安全需求

隨著教育信息化建設的推進,應用系統越建越多,但由於意識、技術和資金等方面的原因,網站被黑、應用癱瘓、數據泄露或被篡改等情況時有發生,安全問題較為突出。

四、並發需求

武漢大學全日制在校生超過 5 萬人,其中本科生 3 萬餘人。這意味著每學期有 3 萬餘本科生進行網上選課;每年有 2 萬餘人報考研究生;同時,高考招生網上宣傳與諮詢量也非常大。這三個應用訪問高峰的時間段也各不相同。

針對這些對並發量以及實時要求高的應用,提供應用的部門包括教務部、研究生院和招生就業處分別購買了性能較高的伺服器,有的還使用了多台,通過 DNS 輪詢解析的方式進行負載均衡,嘗試保證請求的實時響應。但是,DNS 輪詢解析並不能真正做到負載均衡,應用效果不好。另一個方面,這些高性能伺服器大部分時間處於空閑狀態,只是在特定的時間段發揮作用,設備利用率極低。

五、管理水平參差不齊、專業化不足

在教育信息化平台管理中,有些高校的二級學院沒有配備專門的技術管理人員,而是由相關行政人員或專業教師兼為管理。而這些非專門技術人員,對平台軟硬體的日常維護,停留在伺服器的啟停、後台數據的備份等功能性維護上,而對於性能優化、運行安全、負載均衡等專業技術層面的維護往往不足,導致平台在長時間運行後,出現反應遲緩、系統宕機等問題。

為了解決以上問題,武漢大學網路中心在 2012 年初,利用雲計算技術,採用成熟的雲計算軟硬體產品,結合學校自身的特點和實際需求,搭建了共享伺服器群---武漢大學雲平台,作為全校信息化基礎設施共享平台的重要組成部分。武漢大學共享伺服器群充分發揮了網路中心技術和機房條件的優勢,提高設備利用率,實現資源共享,滿足校內各學院和全校師生不同層次和不同角色的服務需求。

3. 解決方案

武漢大學雲平台採用多集群架構設計,由 50 台 x86 伺服器構建的 OpenStack 雲集群 1、26 台使用本地存儲伺服器構建 OpenStack 雲集群 2,以及 22 台使用集中存儲伺服器所構建的開源雲計算實驗室。其中,OpenStack 雲集群 1 包含整個雲平台的管理節點和高配雲伺服器節點(採用 SSD+SAS 磁碟結合的方式,提供高速 IOPS 存儲池 1),用於承載武漢大學的核心業務;OpenStack 集群 2 包含低配伺服器節點(使用 SATA 磁碟,提供低速 IOPS 存儲池 2),用於提供武漢大學部分學生的開發和測試環境;OpenStack 集群 1 和 2 共同構建了武漢大學的核心業務雲平台,通過集成學校現有的統一身份認證和簡訊平台,實現資源的統一調度和管理。通過將伺服器和存儲按照硬體性能進行分組,可為武漢大學不同類型的業務提供不同磁碟性能的資源,並可方便管理員在管理 Portal 上進行調配;可在雲平台中部署 swift 組件,用於對虛擬機和重要的業務數據進行備份。

圖 武漢大學雲平台架構

武漢大學雲平台架構分數據中心區、網路區、用戶區三部分。

  1. 數據中心區

    數據中心區是雲平台的核心區域,用於承載武漢大學各院系網站、選課系統、招生系統等核心業務,所有業務的數據文件均存放在此區域中。

數據中心區提供用戶認證、用戶數據管理、備份;以及各種安全措施的部署,如更新和修補程序等,並支持 IT 運維人員進行統一部署和維護。

2.網路區

用於連通前端師生的終端設備和數據中心,優質的網路帶寬是使用雲服務的基礎,圖形圖像及各種應用的使用,均需要高質量網路帶寬的保證。

3.用戶區

包括武漢大學內各院系師生集中辦公和學習的區域、校外互聯網訪問用戶等,用戶可通過台式機、移動設備等多種終端以 B/S 方式訪問雲平台,以獲取相關的資源。

武漢大學雲平台具備以下特點和優勢:

  1. 可隨時隨地訪問

    憑學(工)號登錄校園信息門戶網站,即可直接訪問雲平台,無需二次輸入用戶名及密碼。

  2. 簡訊提醒

    雲平台的任何關鍵操作或重要信息,比如註冊成功、續費提示、資源告警,能夠自動發送給管理員或普通用戶,簡訊內容支持自定義,保障雲平台交互操作一目了然,雲平台維護更及時。

  3. 快速部署

    雲平台的計算、存儲資源池需要按需快速擴展時,方案可滿足資源使用者的需求能夠被快速響應和滿足。雲平台通過自動化部署手段實現了 IT 資源的快速交付,可實現雲平台 2 小時內快速部署,大大提升快速擴展的能力且降低了因為長時間部署調試帶來的隱性資本損耗。

  4. 數據安全

    武漢大學的所有業務數據完全駐留在雲平台內,存儲設備採用分散式架構,確保在單台存儲設備意外崩潰時數據的零丟失,保證了所有業務數據的數據安全性。同時,可通過搭建 swift 組件構建數據備份資源池,針對整個雲平台中關鍵數據進行備份。

  5. 降低運維管理難度和成本

    傳統雲架構建設時包含:虛擬化伺服器、光纖交換機、磁碟陣列、虛擬化軟體、雲管理套件等,往往選用不同廠家的軟硬體設備,且硬體層次關係比較複雜,在維護時需要考慮的因素比較多,維護難度較大,而本方案中的雲平台架構因為採用橫向設計的分層架構,無太多的硬體依賴關係,因此後期的可維護性更強,可以大大降低武漢大學的運維成本。

  6. 比傳統雲架構更高的性能

    本方案推薦的基於 OpenStack 的雲平台架構比傳統雲架構具有更高的性能。傳統雲架構僅僅是在計算層面實現虛擬化,虛擬機的性能難以保障,難以支撐更大的業務系統 IO,所以無法滿足客戶對於資源多樣化的需求以及保障客戶雲服務 QoS。傳統雲架構的多台虛擬化伺服器在底層還是對應於單點的 NAS/SAN 共享存儲,因此系統的性能瓶頸在於底層存儲無法提供足夠的 IO 能力。雲平台通過完全分散式的存儲架構實現數據多通路高並發;通過 SSD 和 SATA 自動分層存儲機制實現數據訪問 IO 的大幅提升,單虛擬機讀 IO 可達 3 萬+,寫 IO 可達 2.5 萬+,是傳統架構的十倍量級;而且通過針對於虛擬化設計的諸多軟體定義的其他技術機制在多層面保障系統的高性能。

  7. 更好的擴展性

    本方案推薦的雲平台架構具備更好的可擴展性。傳統雲架構底層採用共享存儲設備,共享存儲設備的擴展性受限於其控制單元,即主機頭,主機頭的主機介面和帶寬是有限的,未來隨著業務發展,數據量不斷增加,存儲單元的擴展必然伴隨著存儲性能的下降。雲平台由於採用超融合架構,每個節點機里都包含數據控制單元和數據存儲單元,且各節點機地位對等,需要擴展時僅僅需要添置節點機即可,新添置的節點機和原有節點機構成新的集群,在容量擴充的同時系統整體性能是線性增加的,因此本方案中的雲平台可擴展性更強。

  8. 更高的可靠性和可用性

    傳統雲架構底層採用單點的共享存儲(Share Disk),當存儲系統出現故障時對於整個系統而言是巨大災難。本方案中雲平台架構的存儲層面採用分散式架構,在數據保護層面採用多數據副本機制,因此,集群中任意一個節點損壞都不會對整體造成影響,這樣可以保障系統的高可靠性,而且系統具備數據副本自動恢復的相關機制以保障數據安全可靠。整個系統在各個層面都充分考慮了高可用架構,包括網路鏈路、完全分散式架構、存儲管理、雲管理架構等,這樣可以確保系統構成單元在單點出現故障時不會造成上層業務的中斷而給用戶帶來不可用的體驗,保障業務系統持續的可用性。

4. 客戶收益

武漢大學雲平台,能有效利用武漢大學現有軟硬體設備,通過虛擬化技術統一建設和管理,充分發掘基礎設施的潛能。使用者可按需申請服務,合理利用資源。雲計算的大規模分散式計算能力,能為海量服務請求提供穩定高效的支持,能適應武漢大學信息網路部門、各二級學院、老師與學生等不同層次和不同角色的服務需求,在降低成本的基礎上,充分提高資源的利用率和共享率,促進管理水平的專業化。

  • 用戶使用角度,共享伺服器群具有用戶自服務功能,用戶自行註冊,按需提交資源使用申請,系統管理員審核通過後,管理平台自動根據配置生成虛擬伺服器。用戶通過自服務門戶實現資源的管理、使用及自運維,包括資源生命周期管理、網路管理、虛擬磁碟(雲硬碟)等,無需要管理員的干預。
  • 從高並發需求角度,共享伺服器群利用同期規劃的負載均衡設備,很好地支撐了學校的教學和管理工作。以本科生選課為例:武漢大學共有本科生 3 萬餘人,選課在網上進行,每次網上選課時間為兩天,是很典型的高並發實時訪問的活動之一。在實現共享伺服器群之前,每次開放學生網上選課,教務部伺服器最大能夠承載的並發不到 2000 人,導致學生無法正常選課;教務部選課系統部署到共享伺服器群上以後,已承擔多次全校本科生選課,最大選課並發訪問接近一萬人。
  • 從運維管理角度,通過共享伺服器群管理平台,實現了計算資源、存儲資源、網路資源的集中管理和統一調度,實現了自動化的運維監控,極大的提升了運維效率。
  • 從安全形度,共享伺服器群提供了三重安全措施,一是網路硬體防火牆,提供物理級別的保護;二是軟體防火牆,提供用戶級別的隔離防護;三是應用防火牆,提供應用級別的防護,保證業務系統的安全。

武漢大學採用雲平台後,2012 年-2017 年大大降低了虛擬化及伺服器採購成本 800 萬元,降低了 30%人工成本 200 萬元,提升資源池利用率 40%以上,提升運維管理效率 30%以上。


推薦閱讀:

每天自動備份網站數據,發現問題一鍵恢復 ——阿里雲虛擬主機推出網站數據自動備份功能
在高速通道中如何添加對端路由器介面
糾刪碼存儲系統中的投機性部分寫技術
2017雙11技術揭秘—阿里資料庫進入全網秒級實時監控時代

TAG:EduSoho | OpenStack | 雲計算 |