360°透視:雲原生架構及設計原則

雲原生(Cloud Native)的概念,由來自Pivotal的MattStine於2013年首次提出,被一直延續使用至今。這個概念是Matt Stine根據其多年的架構和諮詢經驗總結出來的一個思想集合,並得到了社區的不斷完善,內容非常多,包括DevOps、持續交付(Continuous Delivery)、微服務(MicroServices)、敏捷基礎設施(Agile Infrastructure)和12要素(TheTwelve-Factor App)等幾大主題,不但包括根據業務能力對公司進行文化、組織架構的重組與建設,也包括方法論與原則,還有具體的操作工具。採用基於雲原生的技術和管理方法,可以更好地把業務生於「雲」或遷移到雲平台,從而享受「雲」的高效和持續的服務能力。

顧名思義,雲原生是面向「雲」而設計的應用,因此技術部分依賴於在傳統雲計算的3層概念(基礎設施即服務(IaaS)、平台即服務(PaaS)和軟體即服務(SaaS)),例如,敏捷的不可變基礎設施交付類似於IaaS,用來提供計算網路存儲等基礎資源,這些資源是可編程且不可變的,直接通過API可以對外提供服務;有些應用通過PaaS服務本來就能組合成不同的業務能力,不一定需要從頭開始建設;還有一些軟體只需要「雲」的資源就能直接運行起來為雲用戶提供服務,即SaaS能力,用戶直接面對的就是原生的應用。

應用基於雲服務進行架構設計,對技術人員的要求更高,除了對業務場景的考慮外,對隔離故障、容錯、自動恢復等非功能需求會考慮更多。藉助雲服務提供的能力也能實現更優雅的設計,比如彈性資源的需求、跨機房的高可用、11個9(99.999999999%)的數據可靠性等特性,基本是雲計算服務本身就提供的能力,開發者直接選擇對應的服務即可,一般不需要過多考慮本身機房的問題。如果架構設計本身又能支持多雲的設計,可用性會進一步提高,比如Netflix能處理在AWS的某個機房無法正常工作的情況,還能為用戶提供服務,這就是「雲」帶來的魔力,當然,雲也會帶來更多的隔離等問題。如圖1-4所示,目前業界公認的雲原生主要包括以下幾個層面的內容。

圖1-4 雲原生的內容

敏捷基礎設施

正如通過業務代碼能夠實現產品需求、通過版本化的管理能夠保證業務的快速變更,基於雲計算的開發模式也要考慮如何保證基礎資源的提供能夠根據代碼自動實現需求,並實現記錄變更,保證環境的一致性。使用軟體工程中的原則、實踐和工具來提供基礎資源的生命周期管理,這意味著工作人員可以更頻繁地構建更強可控或更穩定的基礎設施,開發人員可以隨時拉取一套基礎設施來服務於開發、測試、聯調和灰度上線等需求。當然,同時要求業務開發具有較好的架構設計,不需要依賴本地數據進行持久化,所有的資源都是可以隨時拉起,隨時釋放,同時以API的方式提供彈性、按需的計算、存儲能力。

技術人員部署伺服器、管理伺服器模板、更新伺服器和定義基礎設施的模式都是通過代碼來完成的,並且是自動化的,不能通過手工安裝或克隆的方式來管理伺服器資源,運維人員和開發人員一起以資源配置的應用代碼為中心,不再是一台台機器。基礎設施通過代碼來進行更改、測試,在每次變更後執行測試的自動化流程中,確保能維護穩定的基礎設施服務。

此外,基礎設施的範圍也會更加廣泛,不僅包括機器,還包括不同的機櫃或交換機、同城多機房、異地多機房等,這些內容也會在後續章節中逐一進行部分討論。

持續交付

為了滿足業務需求頻繁變動,通過快速迭代,產品能做到隨時都能發布的能力,是一系列的開發實踐方法。它分為持續集成、持續部署、持續發布等階段,用來確保從需求的提出到設計開發和測試,再到讓代碼快速、安全地部署到產品環境中。持續集成是指每當開發人員提交了一次改動,就立刻進行構建、自動化測試,確保業務應用和服務能符合預期,從而可以確定新代碼和原有代碼能否正確地集成在一起。持續交付是軟體發布的能力,在持續集成完成之後,能夠提供到預發布之類系統上,達到生產環境的條件,持續部署是指使用完全的自動化過程來把每個變更自動提交到測試環境中,然後將應用安全地部署到產品環境中,打通開發、測試、生產的各個環節,自動持續、增量地交付產品,也是大量產品追求的最終目的,當然,在實際運行的過程中,有些產品會增加灰度發布等環境。總之,它更多是代表一種軟體交付的能力,過程示例請參考圖1-5。

圖1-5 持續交付流程

DevOps

DevOps如果從字面上來理解只是Dev(開發人員)+Ops(運維人員),實際上,它是一組過程、方法與系統的統稱,其概念從2009年首次提出發展到現在,內容也非常豐富,有理論也有實踐,包括組織文化、自動化、精益、反饋和分享等不同方面。首先,組織架構、企業文化與理念等,需要自上而下設計,用於促進開發部門、運維部門和質量保障部門之間的溝通、協作與整合,簡單而言組織形式類似於系統分層設計。其次,自動化是指所有的操作都不需要人工參與,全部依賴系統自動完成,比如上述的持續交付過程必須自動化才有可能完成快速迭代。再次,DevOps的出現是由於軟體行業日益清晰地認識到,為了按時交付軟體產品和服務,開發部門和運維部門必須緊密合作。總之,如圖1-6所示,DevOps強調的是高效組織團隊之間如何通過自動化的工具協作和溝通來完成軟體的生命周期管理,從而更快、更頻繁地交付更穩定的軟體。

圖1-6 DevOps強調組織的溝通與協作

微服務

隨著企業的業務發展,傳統業務架構面臨著很多問題。其一,單體架構在需求越來越多的時候無法滿足其變更要求,開發人員對大量代碼的變更會越來越困難,同時也無法很好地評估風險,所以迭代速度慢;其二,系統經常會因為某處業務的瓶頸導致整個業務癱瘓,架構無法擴展,木桶效應嚴重,無法滿足業務的可用性要求;最後,整體組織效率低下,無法很好地利用資源,存在大量的浪費。因此,組織迫切需要進行變革。隨著大量開源技術的成熟和雲計算的發展,服務化的改造應運而生,不同的架構設計風格隨之湧現,最有代表性的是Netflix公司,它是國外最早基於雲進行服務化架構改造的公司,2008年因為全站癱瘓被迫停業3天後,它痛下決心改造,經過將近10年的努力,實現了從單架構到微服務全球化的變遷,滿足了業務的千倍增長(如圖1-7所示),併產生了一系列的最佳實踐。

圖1-7 Netflix微服務化支撐業務千倍增長

隨著微服務化架構的優勢展現和快速發展,2013年,MartinFlower對微服務概念進行了比較系統的理論闡述,總結了相關的技術特徵。首先,微服務是一種架構風格,也是一種服務;其次,微服務的顆粒比較小,一個大型複雜軟體應用由多個微服務組成,比如Netflix目前由500多個的微服務組成;最後,它採用UNIX設計的哲學,每種服務只做一件事,是一種松耦合的能夠被獨立開發和部署的無狀態化服務(獨立擴展、升級和可替換)。微服務架構如圖1-8所示。

圖1-8 微服務架構示例

由微服務的定義分析可知,一個微服務基本是一個能獨立發布的應用服務,因此可以作為獨立組件升級、灰度或復用等,對整個大應用的影響也較小,每個服務可以由專門的組織來單獨完成,依賴方只要定好輸入和輸出口即可完全開發,甚至整個團隊的組織架構也會更精簡,因此溝通成本低、效率高。根據業務的需求,不同的服務可以根據業務特性進行不同的技術選型,是計算密集型還是I/O密集型應用都可以依賴不同的語言編程模型,各團隊可以根據本身的特色獨自運作。服務在壓力較大時,也可以有更多容錯或限流服務。

微服務架構確實有很多吸引人的地方,然而它的引入也是有成本的,它並不是銀彈,使用它會引入更多技術挑戰,比如性能延遲、分散式事務、集成測試、故障診斷等方面,企業需要根據業務的不同的階段進行合理的引入,不能完全為了微服務而「微服務」,本書第5章也會對如何解決這些問題提供對應不同方案的權衡。

12要素

「12要素」英文全稱是The Twelve-Factor App,最初由Heroku的工程師整理起步,是集體貢獻總結的智慧,如圖1-9所示。根據基於雲的軟體開發模式,12要素比較貼切地描述了軟體應用的原型,並詮釋了使用原生雲應用架構的原因。比如,一個優雅的互聯網應用在設計過程中,需要遵循的一些基本原則和雲原生有異曲同工之處。通過強化詳細配置和規範,類似Rails的基於「約定優於配置」(convention over configuration)的原則,特別在大規模的軟體生產實踐中,這些約定非常重要,從無狀態共享到水平擴展的過程,從松耦合架構關係到部署環境。基於12要素的上下文關聯,軟體生產就變成了一個個單一的部署單元;多個聯合部署的單元組成一個應用,多個應用之間的關係就可以組成一個複雜的分散式系統應用。

圖1-9 12要素

下面簡要介紹圖1-9中的這些原則。相信很多開發者在實際開發工作中已經很好地應用了其中的一些原則,只是沒有意識到概念本身。對這些原則比較陌生的開發者,如果想了解更多的操作過程,請參閱《雲原生時代下的12要素(12-Factor)應用與實踐》一文。

基準代碼

每一個部署的應用都在版本控制代碼庫中被追蹤。在多個部署環境中,會有多種部署實例,單個應用只有一份代碼庫,多份部署相當於運行了該應用的多個實例,比如開發環境一個實例,測試環境、生產環境都有一個實例。

實際上,在雲計算架構中,所有的基礎設施都是代碼配置,即Infrastructure as Code(IaC),整個應用通過配置文件就可以編排出來,而不再需要手工的干預,做到基礎服務也是可以追蹤的。

依賴

應用程序不會隱式依賴系統級的類庫,通過依賴清單聲明所有依賴項,通過依賴隔離工具確保程序不會調用系統中存在,但清單中未聲明依賴項,並統一應用到生產和開發環境。比如通過合適的工具(例如Maven、Bundler、NPM),應用可以很清晰地對部署環境公開和隔絕依賴性,而不是模糊地對部署環境產生依賴性。

在容器應用中,所有應用的依賴和安裝都是通過DockerFile來完成聲明的,通過配置能明確把依賴關係,包括版本都明確地圖形化展示出來,不存在黑盒。

配置

環境變數是一種清楚、容易理解和標準化的配置方法,將應用的配置存儲於環境變數中,保證配置排除在代碼之外,或者其他可能在部署環境(例如研發、展示、生產)之間區別的任何代碼,可以通過操作系統級的環境變數來注入。

實例根據不同的環境配置運行在不同的環境中,此外,實現配置即代碼,在雲環境中,無論是統一的配置中心還是分散式的配置中心都有好的實踐方式,比如Docker的環境變數使用。

後端服務

不用區別對待本地或第三方服務,統一把依賴的後端作為一種服務來對待,例如資料庫或者消息代理,作為附加資源,同等地在各種環境中被消耗。比如在雲架構的基礎服務中,計算、網路、存儲資源都可以看作是一種服務去對待使用即可,不用區分是遠程還是本地的。

構建、發布、運行

應用嚴格區分構建、發布、運行這3個階段。3個階段是嚴格分開的,一個階段對應做一件事情,每個階段有很明確的實現功能。雲原生應用的構建流程可以把發布配置挪到開發階段,包括實際的代碼構建和運行應用所需的生產環境配置。在雲原生應用中,基於容器的Build-Ship-Run和這3個階段完全吻合,也是Docker對本原則的最佳實踐。

進程

進程必須無狀態且無共享,即雲應用以一個或多個無狀態不共享的程序運行。任何必要狀態都被服務化到後端服務中(緩存、對象存儲等)。

所有的應用在設計時就認為隨時隨地會失敗,面向失敗而設計,因此進程可能會被隨時拉起或消失,特別是在彈性擴容的階段。

埠綁定

不依賴於任何網路伺服器就可以創建一個面向網路的服務,每個應用的功能都很齊全,通過埠綁定對外提供所有服務,比如Web應用通過埠綁定(Port binding)來提供服務,並監聽發送至該埠的請求(包括HTTP)。

在容器應用中,應用統一通過暴露埠來服務,盡量避免通過本地文件或進程來通信,每種服務通過服務發現而服務。

並發

進程可以看作一等公民,並發性即可以依靠水平擴展應用程序來實現,通過進程模型進行擴展,並且具備無共享、水平分區的特性。

在互聯網的服務中,業務的爆發性隨時可能發生,因此不太可能通過硬體擴容來隨時提供擴容服務,需要依賴橫向擴展能力進行擴容。

易處理

所有應用的架構設計都需要支持能隨時銷毀的特點,和狀態的無關性保持一致,允許系統快速彈性擴展、改變部署及故障恢復等。

在雲環境中,由於業務的高低峰值經常需要能實現快速靈活、彈性的伸縮應用,以及不可控的硬體因素等,應用可能隨時會發生故障,因此應用在架構設計上需要儘可能無狀態,應用能隨時隨地拉起,也能隨時隨地銷毀,同時保證進程最小啟動時間和架構的可棄性,也可以提供更敏捷的發布及擴展過程。

環境等價

必須縮小本地與線上差異,確保環境的一致性,保持研發、測試和生產環境儘可能相似,這樣可以提供應用的持續交付和部署服務。

在容器化應用中,通過文件構建的環境運行能做到版本化,因此保證各個不同環境的差異性,同時還能大大減少環境不同帶來的排錯等成本溝通問題。

日誌

每一個運行的進程都會直接標準輸出(stdout)和錯誤輸出(stderr)事件流,還可以將日誌當作事件流作為數據源,通過集中服務,執行環境收集、聚合、索引和分析這些事件。

日誌是系統運行狀態的部分體現,無論在系統診斷、業務跟蹤還是後續大數據服務的必要條件中,Docker提供標準的日誌服務,用戶可以根據需求做自定義的插件開發來處理日誌。

管理進程

管理或維護應用的運行狀態是軟體維護的基礎部分,比如資料庫遷移、健康檢查、安全巡檢等,在與應用長期運行的程序相同環境中,作為一次性程序運行。

在應用架構模式中,比如Kubernetes裡面的Pod資源或者dockerexec,可以隨著其他的應用程序一起發布或在出現異常診斷時能通過相關的程序去管理其狀態。

雲原生的內容非常廣泛,目前沒有系統的說明和完整的定義,上文介紹了雲原生應用的基礎組件和相關特點,可能讀者對雲原生應用的邏輯還存在一些困惑。為了更清楚地進行說明,我們總結了其依賴關係,如圖1-10所示。

圖1-10 雲原生內容的依賴關係

首先,為了抓住商業機會,業務需要快速迭代,不斷試錯,因此,企業需要依賴擁有持續交付的能力,這些不僅包括技術需求還包括產品的需求,如何能擁有持續交付的能力,大而全的架構因為效率低下,顯然是不合適的。於是演變出微服務架構來滿足需求,通過把系統劃分出一個個獨立的個體,每個個體服務的設計依賴需要通過12要素的原則來規範完成。同樣,如果系統被分成了幾十個甚至幾百個服務組件,則需要藉助DevOps才能很好地滿足業務協作和發布等流程。最後,DevOps的有效實施需要依賴一定的土壤,即敏捷的基礎設施服務,現實只有雲計算的模式才能滿足整體要求。通過上述梳理,我們總結出面向雲原生應用的3個不同層次的特點。

  • 高可用設計(Design for Availability),依據應用業務需求,高可用分為不同級別,比如不同區域、不同機房(跨城或同城)、不同機櫃、不同伺服器和不同進程的高可用,雲原生應用應該根據業務的可用性要求設計不同級別的架構支持。
  • 可擴展設計(Design for Scale),所有應用的設計是無狀態的,使得業務天生具有擴展性,在業務流量高峰和低峰時期,依賴雲的特性自動彈性擴容,滿足業務需求。
  • 快速失敗設計(Design for Failure),即包括系統間依賴的調用隨時可能會失敗,也包括硬體基礎設施服務隨時可能宕機,還有後端有狀態服務的系統能力可能有瓶頸,總之在發生異常時能夠快速失敗,然後快速恢復,以保證業務永遠在線,不能讓業務半死不活地僵持著。

通過上面的基本描述及雲原生應用的組成或特點,與容器技術(第2章將詳細介紹)相比可以得知,容器的特性天生就是按這些原則進行設計的。隨著互聯網業務的架構不斷演進,從單體應用到分散式應用,甚至微服務架構應用中,12要素較好地為構建互聯網化應用提供了統一的方法論和標準化,具有強大的生命力,每一條原則都是應用開發的珠璣。當然,在實踐過程中,每一個原則也不是一成不變的,隨著新的理念和技術出現,原有的因素會得到延伸和發展,會出現新的原則和應用,這套理論也適用於任意語言和後端服務(資料庫、消息隊列、緩存等)開發的應用程序,因此也作為雲原生架構應用的基本指導原則之一。

本文節選自《雲原生應用架構實踐》,網易雲基礎服務架構團隊著,全程詳解單體到分散式服務化架構的演進。更多精彩內容,敬請期待下期分享。對雲原生感興趣的讀者,歡迎掃碼閱讀全書。

item.jd.com/12219496.ht (二維碼自動識別)

文/網易雲基礎服務架構該團隊

推薦閱讀:

全局唯一ID在分散式系統中用來做什麼用?
探究高可用服務端架構的優秀資料索引
資料庫高可用的定義和度量
高性能、高可用、可擴展的MySQL集群如何組建?
開源資料庫MySQL架構優劣對比

TAG:架構 | 雲計算 | 高可用 |