標籤:

運維團隊能力建設的另一思路

作者介紹

溫崢峰,小鵬汽車互聯網中心運維技術專家,車聯網運維高級經理,超過8年互聯網運維經驗,曾就職於網易遊戲、百田信息,經受過各類海量規模互聯網業務模式的歷練,專註於運維自動化、DevOps實踐、運維服務體系建設與SRE時代下的運維價值挖掘。

知乎專欄:HiPhone運維之道

筆者在專欄前面的文章里曾描述過廣義的運維服務體系,而運維服務是通過團隊中每位成員來具體落實的,它是團隊能力輸出的一個綜合結果。

那麼如何搭建一個優秀的團隊才能輸出高質量、穩定、可靠的運維能力呢?

角色分工

// 此處寫一段NBA隊伍和運維團隊的角色類比,純粹瞎編,just for fun~

一個完整的籃球隊伍體系,最少要包含以下角色:

組織者:

負責全隊組織、串聯,是團隊的戰術發動機,具備良好的大局觀【代表人物:詹姆斯、保羅、哈登、納什】

運維類比:具備長遠的規劃能力,能挖掘每位組員的潛能,能帶領團隊走向正確方向的Team Leader

得分手:

頂尖的得分能力,關鍵時刻能依賴個人能力打破得分僵局【代表人物:喬丹、科比、杜蘭特、艾佛森、麥迪】

運維類比:能在某些方向具備強悍技術攻關能力或者達到有業界影響力水平的技術專家

策應者:

團隊戰術的中轉站,具備良好的視野和賽場閱讀能力【代表人物:鄧肯、加內特】

運維類比:能和業務方或者第三方服務商進行良好的協作溝通和運維資源調度的運維人員

防守者:

防守尖兵,凍結對方的得分手【代表人物:倫納德、皮蓬、巴蒂爾】

運維類比:能利用各種技術手段和業務運營思維完成全方位業務運行質量監控的運維人員

籃板保護者:

控制籃板球且能主宰比賽的籃下怪物,由防守轉向進攻的起點【代表人物:奧尼爾、張伯倫、霍華德】

運維類比:能把運維工作從被動式運維進化為主動式技術運營的運維人員

以上角色分配並非一成不變,有些人也能同時兼任幾種角色,如詹姆斯能兼任以上5種角色,其他超級巨星也至少能兼任2、3種角色。

在虎撲bbs曾經對NBA歷史第一陣容有過廣泛的討論,最終能讓絕大多人信服的結論就是「魔神皇佛鯊」,組合名雖然畫風中二,但很有辨識度,而這套陣容唯一的明顯短板就只是缺乏穩定的三分輸出而已。

他們5人分別是

魔:

控球後衛--魔術師約翰遜,身高206cm,利用身高優勢用大屁股碾壓對位的防守者,具備良好的大局觀和無死角的傳球能力;


神:

得分後衛--籃球之神喬丹,身高198cm,歷史最頂尖的得分能力,攻防一體,無需多介紹;


皇:

小前鋒--皇帝詹姆斯,身高203cm體重110kg以上,歷史級別的身體素質加頂級球商,現役最全面的球員沒有之一;


佛:

大前鋒--石佛鄧肯,身高211cm,內線防守基石加上穩定的得分輸出,兼備上乘的策應能力;


鯊:

中鋒--大鯊魚奧尼爾,身高216cm體重135-160kg之間的重型坦克,可以在內線肌肉群裡面翻江倒海,兼顧籃板、內線得分、防守;

對於不懂籃球的人可能會想:要贏比賽就是比得分而已,直接把歷史前5的得分王弄一起不就行了嗎?

那麼這陣容很可能是喬丹、科比、杜蘭特、艾佛森、麥蒂、張伯倫、賈巴爾等人的隨機組合。

這樣的得分王陣容能戰勝上面的「魔神皇佛鯊 」嗎?

我認為是不行的~好的團隊需要配置均衡與全面發展,這個道理對於任意的團隊體育運動應該都是適用的。

同理,對於運維團隊,直接堆5個頂級技術專家在一起,這個團隊的綜合能力也未必能達到最好效果。

個人能力

如何量化一個運維工程師的個人能力,首先是要確立能力指標的種類,這裡為了簡化模型,只取了6個指標:操作系統、運維自動化、虛擬化與容器、網路與安全、監控體系建設、業務支撐能力。

現實世界中肯定需要有更多的指標項,而且考量的標準也會更加複雜,拋開現實中的繁雜,這裡我們只做一個最簡單的數字模型。

假設有4個運維工程師,分別是 A B C D,他們的各項數值我用下面的圖例來表示。

如圖所示,A 和 B 是能力數值比較平均的兩個人,他們在這6項技能的數值都比較相近,有某些技術方向較好的能力值且其他方面沒有明顯短板;而 C 和 D 的有能力特長且有明顯短板的兩人,當這兩類人分別組成團隊的時候會產生怎樣的化學反應呢?

團隊能力

如圖所示,我們假定整個團隊的能力指標的數值取決於團隊最強那個人的數值高低,其中藍色線是由一群能力平均的 A 和 B 組成的團隊, 而黃色線是由一群有能力特長的 C 和 D 組成的,而且 C 和 D 的技能項剛好互補,那麼特長組合的團隊能力的數值就會全面提高。

當然,上面所取的數值是比較極端的,是完全理想化的情況。

這是為了表達一種團隊建設的思路:利用某些具備能力特長的人員大幅度提升團隊的單項能力上限。

一些經驗

前文的經驗都是我最近工作中切身感受到的,因為我所在的初創公司正在組建運維團隊,上級領導的思路是在人員總量不多的前提下,盡量招聘能獨當一面的技術專才,而不是招聘各方面平庸的技術通才。

這和我以往的經驗有很大的差異,我向來都是傾向於招聘和自己「類似」的隊友,因為人很容易陷入自己的主觀判斷和心理舒適區,和自己「類似」的人往往更加容易溝通和管理。但是,這樣的組建思路對整個團隊的全面能力發展未必有好處,正如上圖中的團隊綜合能力比較,可以明顯看出非常符合這個推論。

運維團隊是為了解決業務保障問題而存在的,團隊建設者要做的不是平衡每位成員的能力,而是要發揮團隊的最大能力值,如果有成員在某些領域特彆強,那麼 Team Leader 需要竭盡所能為其創造最佳的能力輸出場景,而非浪費資源和時間為其補上短板。

然而,凡事都是有兩面性,一群技術專才組合起來的團隊必然比一群平均的團隊更加考驗 Team Leader 的管理水平,挖掘各位隊員的能力並使之帶動整個團隊的能力提高是 Team Leader 的工作重心之一。團隊管理關注的不是人,而是人和目標、人和資源、人和人之間的關係,好的團隊管理者是要引導人和資源以及和其他人能夠更好的協作,達成目標。

對個人提升的建議

作為運維工程師,最理想的狀態是沒有明顯的技能短板,又有某些技能特長能給團隊帶來更高的上限。比如你身邊肯定有些大牛,他身上的標籤可能類似「Docker大牛」、「AI演算法專家」、「Linux內核代碼提交者」、「MySQL性能調優聖手」等等,這個時候只要你有某些方向足夠牛逼,大家也不會關注你有哪些短板,例如即便是 AI 專家也很有可能不知道 TCP 三次握手四次揮手,但這不影響他的牛逼。

我們可以每隔一年或者半年對自己有一個完整的能力評估,評估的方法有很多,我自己習慣用兩種方法快速地 review,分別是橫向和縱向評估。

橫向:

橫向方法是和同齡人相比,去掉一些大眾化的技能之後,我還剩餘哪些技能高於業界平均水平?

縱向:

縱向方法是和去年同期的自己相比,我有哪些技能有所提升?

如果橫向和縱向對比都沒有一個比較好的結果,大家也不用灰心,我在職業生涯的前5年基本也處於啥都會點卻都不精通的狀態,及早知道自己的優勢與劣勢,再從戰術、戰略層面提高自己也為時不晚。

如果發現自己沒什麼特別有競爭力的技能的話,不妨從業界當前最熱門的技能中選擇自己最感興趣的一項重點突破,現在運維業界最熱的辭彙有:DevOps、虛擬化、容器、大數據、雲計算......

花一兩年時間專攻一項,下一年的 review 中你會發現自己會越來越有進步,然後有正向反饋讓自己繼續專註下去,以培養自己的核心競爭力。

注意是只選一項,而不是多項,上面提到的幾個熱門方向都有足夠高的邁入門檻,花一兩年時間能完成一項已經是非常厲害了,祝好運!

推薦閱讀:

高德地圖基於阿里雲MaxCompute的最佳實踐
運維體系中建立反饋機制的重要性
運營平台在運維體系中如何注重清單的應用

TAG:運維 | DevOps |