小邪在阿里的十年技術人生
來自專欄阿里機器智能5 人贊了文章
2008年4月,小邪正式入職阿里巴巴,首次接觸淘寶商城項目,拉開了十年的阿里技術生涯。去年12月,小邪加入阿里雲,成為飛天八部掌門人。本文邀請到小邪進行了專訪,就其在阿里十年的經歷進行了深入訪談。此外他還分享了阿里的技術發展史以及職業生涯感悟。
第一個項目以及最大的項目
淘寶商城(現天貓)是小邪加入阿里的第一個項目,彼時淘寶商城正處於公測階段,而他主要負責品牌導購,即淘寶上的品牌頁,通俗點說就是讓用戶可以根據字母(例如耐克、阿迪達斯等等)順序篩選品牌。
對於外界而言,鑒於阿里巴巴在電商領域紮根多年的經歷,要複製淘寶的成功並非難事。但事與願違,早期的淘寶商城表現並不盡如人意。
「2008年正是電商快速膨脹的階段,整個行業都呈現出較為浮躁的氛圍,不斷有巨頭進入,也不斷有公司倒下」,小邪如此回憶。
而在這樣的大環境下,淘寶商城的問題很快凸顯出來,整個網站的流量持續走低。在小邪看來,淘寶商城業務不理想的原因主要有兩個:一是商品進入門檻非常高;二是淘寶的流量無法分流。因為淘寶商城和淘寶完全獨立,除了會員數據之外,所有的系統都是獨立的,包括商品、交易、積分、商品管理甚至還有論壇全部是獨立的兩套體系。
淘寶是按照商品緯度來展現商品,淘寶商城的結構則是按照SPU緯度展現的。只要是技術能解決的問題都不是問題。在淘寶商城整體業績表現不佳之後,兩個團隊的負責人很快便開始規劃將兩個平台的數據打通,內部稱這個項目為「五彩石」,這距離小邪第一個項目的完成才短短數月。
「我在這裡面主要承擔了幾個事情:一是重建原來的導購系統,以打通淘寶和淘寶商城的底層;二是與搜索團隊對接;三是負責商品管理方面的研發工作,例如商品的上下架、補貨等等。」五彩石項目從2008年10月開始,歷時半年才正式完成。
無論是對小邪個人還是對阿里巴巴而言,五彩石項目都極具意義,它把淘寶和淘寶商城徹底打通,並且是首次在整個架構層面引入中間件,並對整個系統進行了分散式化的改造。小邪坦言,在此之前,由於業務體量大、需求變更頻繁,導致項目整體的研發效率非常低,而且在資料庫上還是採用傳統的IOE架構,也帶來了很多複雜性問題,中間件的應用很好地解決了這些問題。
「五彩石項目為天貓後續的發展奠定了堅實的基礎,也奠定了今天的系統架構;對我個人而言,這個項目也讓我對整個電商系統有更深的理解。」
技術進階:全鏈路壓測和雙十一
當然,這僅僅是開始。淘寶商城業務的高速增長又給整個技術體系帶來了新的問題。
小邪表示,分散式系統的應用對穩定性的挑戰非常大,簡單來看,保持穩定性需要做監控、流量規劃、服務治理等等很多事情,而這些產品後來都成為了阿里巴巴集團的整個穩定性的基礎設施。
「我印象最深刻的就是2013年開始做全鏈路壓測。」
以雙十一為例,全鏈路壓測就是模擬雙十一的流量以及用戶規模,通過模擬這樣複雜的場景來監測錯誤並且提前解決。2013年,淘寶商城的體量急劇增長給分散式系統帶來了很多複雜的問題,而在當時來看,做全鏈路壓測技術是最有效的解決方案:它可以合理規劃系統流程,可以讓集群的資源被充分利用,用最少的資源具備最高的流量水位。
「但我們在2013年把這些問題都有效地解決了,所以2013年的雙十一表現得非常好」,這也是技術的核心價值所在。
風雲十年:曆數阿里技術體系變革
2008年入職阿里,到2012年執掌中間件團隊,再到如今的阿里雲飛天八部負責人,小邪的角色在不停轉變,整個阿里技術體系這十年更是迎來了翻天覆地的變革,在他看來,主要有三個變化:
- 第一個變化是從開源到自研。阿里從大量使用開源技術到越來越多的自研技術,因為開源技術不管是從代碼質量、還是功能需求上都難以滿足業務需求,所以團隊必須要有很強的自研能力。當然,到自研之後團隊又做了很多開源,來使產品運行得更好。
- 第二個變化是從煙囪式架構到分散式架構。隨著業務規模的增長,分散式是必然,今天沒有一台伺服器、一個系統能夠支持如此大的計算能力。
- 第三個變化是從追求合格到追求極致。阿里在不斷地推動技術進步,並在落地過程不斷應用完善。不論是雲計算,還是團隊正在研發的IaaS、資料庫、伺服器、業務系統等等,它都是一個不斷迭代生長的過程,在領域內追求極致創新。
技術成長:角色轉變也是職責轉變
在阿里雲意味著更貼近客戶,這對小邪來說是最大的改變。
「以前在中間件團隊,產品以及團隊磨合都比較成熟了,因此我們的關注點都聚焦在每年雙十一的挑戰上。但是在阿里雲,我們會面對各種需求,並且要求我們通過產品去呈現——這個是很大的區別」,小邪認為,阿里雲既是一個技術團隊也是一個商業團隊,這是非常本質的區別,需要不斷通過客戶反饋的需求來對產品進行優化。而整個需求的反饋到響應,都需保持通暢。
但小邪認為這其中並沒有水土不服,兩個團隊都有共同的使命跟願景,以及對創新的極致追求。在阿里雲的這半年時間裡,這支團隊的戰鬥力也超出了他的預期。「阿里雲團隊的整體技術實力非常強,團隊經過多次錘鍊對市場的敏銳度都非常出色,這個團隊的戰鬥力非常強。」
阿里雲飛天八部對外輸出了彈性計算、資料庫、網路以及存儲等核心業務,毫不誇張地說,這也許是小邪近十年最大的一次戰役。對此,小邪認為團隊接下來主要做三件事:第一是去解決客戶痛點;第二個是提升產品競爭力,提升產品性價比、穩定性等指標;第三是持續引進雲計算方面的頂級人才。
「我不希望團隊去盲目追逐熱點,對於研發團隊來講,專註於技術是最核心的任務。」
Q&A:直面小邪
阿里技術:飛天八部最近在技術領域取得的一系列突破,令人矚目。新一代彈性裸金屬GPU伺服器(神龍)和關係型雲資料庫POLARDB的發布、全球首發8K視頻直播技術、飛天雲操作系統核心技術及產業化項目」獲得中國電子學會科技進步特等獎等。在這些成就的背後,你認為有哪些成功因素?
小邪:這得益於我們的研發策略「上拉客戶需求,下推產品競爭力」策略,阿里雲所有的技術產品都是圍繞客戶需求展開的,產品要圍繞市場需求,用戶體驗來做,通過銷售、實施、服務團隊的需求建立持續跟蹤的機制,確保客戶需求是被很好地反饋和收集的,並被持續完成發布上線。
8K視頻就是我們觀察到在企業現場直播市場對此有很大的潛在需求,所以我們會快速通過技術研發和技術整合進行產品化。另外阿里巴巴集團自身的場景主夠的豐富,全世界最大的電商平台,最大的支付平台,還有物流平台、視頻直播、地圖等等,就像是一個很大的預演社會,什麼場景都會遇到,也是得益於我們在絕大多數公司遇到技術挑戰之前已經完成了探路和建路的過程,我們提前把路上遇到的坑也都填平了,再加上阿里巴巴的中台機制,能夠將這些場景化的技術轉化為通用類技術,所以通過這個「社會」+「中台」機制沉澱出來的產品有主夠遠見和競爭力。
阿里技術:我們經常聽到一句話——技術拓展商業邊界。技術不只服務業務,也為業務提供創新驅動力。對此你是如何理解的?能否舉例和大家說明?
小邪:技術創新能為業務提供創新驅動力,長遠來看,所有的業務的成功都是由技術來推動的。我們需要做的就是不斷通過領域內的創新,簡化技術使用門檻,推動貴族技術的不斷平民化的過程。原本需要用人解決的問題,用技術解決,原本昂貴的技術用便宜的技術解決,這種樸素的訴求是不會改變的。
比如原來需要自建,自運維IDC,今天在阿里雲上只需要一個賬號就能解決,原來需要「高端企業的資料庫」場景,明天可以簡單使用我們的POLARDB就能解決。技術的創新有個臨界值,很多技術不成功不是方向不對,而是沒到臨界值。車牌的識別準確率在95%以下的時候是沒有商業價值的,一旦超過這個值之後,就會出現技術推動商業發展,然後商業又推動技術進步的正循環過程。 今天每個技術要麼成熟地支撐於業務,要麼還處在類似「車牌識別的95%準確度」 之下,這種處在創新中的技術,只需要花點時間,給點耐心,就會有爆發的那一天。
阿里技術:作為一名十年阿里人,在這十年中,你覺得印象最深刻的事是哪一件?
小邪:今天回過頭來看,最有意義的一件事情是完成了阿里巴巴集團各個業務板塊的中間件技術統一,中間件決定了我們技術的分散式架構體系,這些技術的統一使得我們系統的運維統一、研發統一、學習過程變的簡單,我們的工程師從一個部門到另一個部門工作不存在技術門檻。同時集團所有業務的分層架構也變的統一而清晰,業務板塊業務的互相依賴調用也變得非常簡單,對集團整體的中台戰略提供了技術基礎。後來把這些分散式技術產品化,推動並完成了在阿里雲上技術的輸出,使得中國大量企業在往互聯網業務轉型過程中可以簡單地獲取阿里雲互聯網中間件的產品和服務。
後記
小邪是一個謙卑柔和、極易相處的技術大神,在採訪過程中,小邪多次強調技術人應當認真、謙虛、自我學習、並且保持自信。此外,儘管在阿里雲工作的節奏很快,但他從未忽視對家庭的責任擔當。
「在工作之餘也要處理好家裡的事情,我會把工作中一些有成就感的事、有趣的事都分享給他們。」
彩蛋:關於小邪,你還有什麼想了解的事情?在留言區寫出你好奇的問題,下次阿里妹將帶著你的問題,去請教大神哦~
推薦閱讀: