雙十一時,阿里的技術人員在後台做了些什麼?

對於如此龐大的一個電商節,我好奇阿里後台的技術們那一天在做些什麼?希望阿里的大佬們能給我漲漲見識



人肉運維也是有的,比如付款渠道,部分銀行可能會被大量交易打掛,而銀行系統一般堵塞了也不會通知你,以前每到這時候就有一個苦逼小哥站在電腦前面看數據,然後手動把那個銀行下線一會,上線一會,下線一會,上線一會。。。然後領紅包!這時候HR小姐姐多半會送來第二天的早餐。

會有專門操作這些東西的後台系統,不過關鍵時候還是人肉去決策的,你要輸入自己的用戶名密碼然後點好幾個讓人神經衰弱的警告框框???。

如果老闆想的話也可以設置一些規則啦,但是那樣容易最後出現意想不到的結局。。

近幾年不會了,涉密就不說了。當然花唄也是做了一些微小的貢獻的,減輕了銀行的壓力。最後如果因為運維原因出了什麼差錯,日後也會追究責任。這就是人肉的妙處啦,如果人工智慧決策,老闆能開除誰去啊?

————————————————————————————————————

(更)

還有個小哥會苦逼地不停刪系統日誌。這又是另一個故事了,首先啥是日誌大多數人都不太了解。日誌就是伺服器寫的日記啊!就像蔣公那樣,事無巨細把自己經歷的事情保存在硬碟裡面,於是最終服務完成並關閉了但是日誌還在。你可以想想一下,一個伺服器每秒鐘要創造幾萬個蔣公,每個都寫完日記然後關閉了自己,這對於存儲容量的壓力還是很大的。一般情況下這些日誌會有一個生命周期,在比如一周到三十天之後刪除掉,這樣在日誌刪除之前,如果系統出了問題,我們就可以回來翻翻日誌,看看究竟是哪裡不太對勁。我們甚至可以對比一下蔣公日記和羅斯福日記,看看究竟美國給他打了多少錢,或者國母去美國有沒有給蔣公買漂亮的帽子什麼的。

但是當雙十一到來的時候,伺服器的壓力忽然激增,怎麼辦呢,運維人員就會下線一些不必要的功能,首當其衝就是日誌。然而由於種種原因,日誌這個東西通常會從伺服器上運行的各個軟體上源源不斷產生出來,不能關水龍頭你就不停拿著桶倒水吧!於是小哥不斷去刪除,不斷去刪除,體會農民伯伯豐收的喜悅呀!

有一天(不是雙十一),某個幼兒園不是很好的公司(不是阿里)一個小哥編了一個腳本用來刪除日誌,因為他實在太困了,編寫的時候搞錯了文件夾位置,最後某重要軟體居然也順帶著被刪除了!後來他成為了實習生,並按照實習生待遇開除了。並不是實習生才犯錯,而是犯錯了你就成了實習生呀。

最後,增加機器的質量和數量也是很重要的,有了大量新運維技術和雲化虛擬化的支持,將來這樣的苦逼小哥會越來越少。

又或者當人工智慧真的來臨,會去新的崗位變得更忙呢?

————————————————————————————————————

(更)

閑的就再更一次吧,反正乾貨這個東西,苦逼的加班程序員一般是不少的,輪子哥大佬又在樓上說不定能蹭熱度呢。

樓下阿里雲來了我就說下資料庫。最簡單的資料庫,當然就是一個文件,你把它放在硬碟上就行了,需要讀的時候,用戶就把一個文件「上鎖」,意思就是我拿走去修改了,你們都不能和我一起修改,不然文件內容就亂了。當然這在雙十一的時候是不行的,如果我們把所有用戶的數據放到一個地方,那每次只能修改一個用戶數據,怎麼可能抗住幾億人的剁手呢!

資料庫優化是個很大很大的話題,舉個例子,資料庫架構師(很久很久以前)想到了簡單的方法,就是所謂垂直拆分和水平拆分。就像一個班級的作業一樣,你把作業分成每個人的作業本就是水平拆分,把同類型的數據拆分成不同的大列表,這樣老師就可以每次只拿到其中一個人的作業批改,兩個老師同時批改不同同學的同一科目作業。垂直拆分呢,就是把作業分成不同科目,這樣每個科目的老師可以分別批改自己科目的作業,於是我們的工作效率又提高了。一個班有60個學生,7門課程,那樣我們就可以通過垂直和水平拆分做出420份資料庫文件(稱為表)。

與剁手黨的鬥智斗勇讓阿里的資料庫技術非常靠譜,阿里的資料庫目前已經開源了幾個,淘寶研發的 OceanBase 相比其他開源的 noSQL 資料庫有什麼獨特的優點?不過不是很推薦小公司使用就是啦(部署成本,有錢才能為所欲為)。

給我點贊一下就說更多運維趣事。


等出事,然後修bug。否則就正常工作。


我猜肯定少不了吃的吧,網上看的圖,貌似很好吃的樣子!


雲棲君來回答下這個問題。

每年天貓雙11已經成為中國科技力量的一次「大檢閱」。

11秒交易額破億,28秒破10億,3分01秒破百億,40分12秒破500億,9小時破1000億……2017年11月11,天貓雙11背後的全球最大規模混合雲再次經受住了令人咂舌的考驗。

當全球上億人流在互聯網上彙集,更多人好奇的是,世界互聯網史上最大規模的並發流量洪峰又飆升了多少?數據顯示:今年交易峰值32.5萬/秒,支付峰值25.6萬/秒,比去年增長超1.1倍,再次刷新全球紀錄。同時誕生的還有資料庫處理峰值,4200萬次/秒。

發展至第九年,天貓雙11的意義早已超越消費和零售領域,是史無前例的社會化大協同,成為商業、經濟、科技變革的最大試驗場。而全球最大規模混合雲也成為天貓全球購物狂歡節為世界貢獻的中國技術方案最佳實踐。

但是,對於阿里技術人來說,最重要的任務不是創造逆天的交易額。

早在雙11前夕,阿里巴巴集團CTO行癲就給阿里兩萬多位工程師下了一個很新鮮的KPI——「雙11晚上,大家的主要任務是喝茶。」

2017天貓雙11,既是人類商業史上最大規模的一次協同,也是互聯網史上最大規模的一次流量並發。究竟阿里技術人是如何做到喝著茶創造雙11奇蹟呢?

原來2017年天貓雙11,實現了人類科技史上最大規模的一次機器智能應用:

機器智能推薦系統,生成個性化頁面,實現人見人愛的「千人千面」;

魯班AI設計師,自動生成多樣廣告圖,每秒製作8000張雙11海報,沒有一張雷同;

阿里小蜜機器人,承擔海量客服諮詢量,帶來傳統服務行業模式的變化與體驗提升;

IDC智能機器人,365天*24小時巡檢不間斷,接替了運維人員以往30%的重複性工作,實現了數據中心無人值守;

......

人機協同的時代已然到來。阿里強大的智能技術,為雙11創造了獨一無二的體驗:

阿里語音技術,將人類語音轉換為機器可讀信息,使產品「能聽、會說、懂你」;

AliNLP平台,通過機器理解人類語言的含義,讓機器更懂你;

阿里圖像技術,讓機器識圖,雙11當天拍立淘成為消費者買買買的便捷方式;

......

當然,我們不會忘記了默默無聞、卻又強大可靠的技術基礎設施:

阿里基礎網路,具備自愈能力,實時故障發現和收斂,並自動恢復,全面保障雙11業務穩定運行;

混部技術,基於全網pouch容器化和Sigma調度技術,雙11期間混部集群資源利用率大幅提升,IT資產新增成本顯著削減;

基礎中間件,掌控超千億規模消息推送和分散式資料庫調用,支撐雙11洪峰消息;

新一代分散式資料庫集群X-Cluster,全面兼容MySQL 5.7,服務雙11淘寶天貓核心交易系統,支撐零點峰值交易;

實時計算平台Blink,支撐阿里絕大部分實時計算任務,雙11當天毫秒級延遲;

離線計算平台MaxCompute,承載阿里所有離線計算任務,支撐每日百萬級規模作業;

......

史上最大規模的人機協同、全球前沿的智能技術保障、強大的互聯網基礎設施,創造了交易創建峰值 32.5 萬筆/秒,支付成功峰值 25.6 萬筆/秒的歷史記錄。

2017天貓雙11,成為互聯網史上實至名歸的超級工程,讓全球消費者享受如絲般順滑的購物體驗,盡情享受快樂雙11。

-----------

要想詳細了解2017天貓雙11背後所有技術,可看下方長圖!

高清大圖下載地址https://yqfile.alicdn.com/8a7010c1919319acd80a32aa91c27680065e312a.jpeg

要希望與相關專家細緻學習與溝通,歡迎報名雲棲社區的在線技術峰會——12月13日-14日《2017阿里雙11技術十二講》,了解雙11背後的技術。

阿里下一代技術架構:雲化架構演進之路——叔同

2017雙十一供應鏈的那些事兒——粵謙

分散式存儲系統盤古在雙十一中的戰役——省身

雙11中的智能化網路實踐——后羿

霸下:七層流量清洗——鐵花

人工智慧在商品搜索中的應用——三桐

阿里智能運維平台如何助力研發應對雙11挑戰——如柏

未來已來:阿里新一代資料庫技術在雙11中的應用——張瑞

雙11萬億流量下的分散式緩存Tair技術揭秘——宗岱

2017雙11交易系統TMF2.0技術揭秘——毗盧

爭分奪秒:阿里實時大數據技術助戰雙十一——蔣曉偉

網路虛擬化技術為雙11提供靈動網路——江鶴

更多技術乾貨敬請關注云棲社區知乎機構號:阿里云云棲社區 - 知乎


在公司看雙十一晚會,和同事交流買什麼東西好,搶紅包,到零點的時候看著流量蹭蹭往上漲,然後看沒啥事吃了夜宵回家睡覺


如果他們在這麼多年曆練後還雞飛狗跳的緊急加班打版本熱更新再調試一下負載平衡什麼的,還是大佬不?


最大的工作量是看屏幕刷日誌。


在清空自己電腦里那些搶秒殺的腳本,尤其是搶月餅的腳本,全盤搜索刪除。


應該問雙十一之前的半年,阿里的技術人員在後台做了什麼?


不是阿里但也是電商行業,可以回答一個打遊戲 吃夜宵 看錶演 買買買 押數據 刷日誌之外的正經事,就是隨時準備限流。每條業務線都有自己的限流策略,主鏈路還有整體的限流策略,每條線由一個或多個專人負責,按照各種情況打開各級限流策略,從開始的業務降維,再到限制請求。

代碼早實現好的,直接在線切各種配置,經過n輪壓測,基本上什麼情況打開什麼,什麼情況再關上,早已心中有數。

雙十一那天砍柴的活已經很輕鬆了,功夫都在前面磨刀的時候。


話說今年阿里雲確實比去年強不少啊,去年前一分鐘都一直是網路錯誤,今年30秒之後就能順暢的下單了,不得不佩服一下技術人員。。


非專業人員,只是去年單位曾有幸請到阿里的技術首席講過一次課,正好我也去了,印象很深,至今沒忘。

按他的描述,他說我們這些單位防範攻擊的措施已經太老了,在他們阿里的技術人員看來,雙11就是一次來自全國各地的瘋狂攻擊,你在淘寶頁面的每一次點擊,對他們來說就是一次攻擊。

然後他簡單介紹了他們是怎麼防護的,鑒於他講課肯定不會透露他們的機密,我就放心大膽的把他講的全寫出來了。

大概意思就是,因為雙11的點擊實在是太多了,他們早已經拋棄了節點防禦這種垃圾模式,採用了一種類似於膜防護的架構(具體怎麼搞得一個是他語焉不詳,一個是我不是專業的也領會不到多少了)。

然後通過雙11前的數據分析,已經大概能判斷那部分點擊和付款會很多,然後加強這幾個部分。

然後就如輪子哥所說,雙11當晚,坐在電腦前,等著哪兒出問題了,就修補。。


森馬服飾前11s五折…然後卡了1分鐘這個…

阿里仍需努力啊! @阿里云云棲社區


我只在朋友圈看到阿里上班的同學部門集體啃著大閘蟹加班,寓意謝謝各位老爺的錢包?


我不是阿里的,我是天馬的,強行作答

下面您將看到的是地球上第一個智能機器人在2017.11.11一個小抖威風掙了他一個億的故事。

大家好,我叫天馬,根據目前地球人對人工智慧的追捧,叫我天馬AI GO我會更喜歡。

我的製造者是外星人Jack Ma。他在最近幾年的11月11號創造了巨大的購物節。

我更喜歡叫我的老闆馬爸爸叫馬BOSS,我覺得這個稱號才配的上他,我的老闆不喜歡錢,他也曾很多次說過後悔創造了我,因為他覺得我是個麻煩,但是隨著地球人對人工智慧的渴望,馬BOSS還是越來越多的開啟的我的許可權。

2017年雙11在全球最大的天馬購物平台上,天馬AI GO(就是我)根據人們對於商品、品類、品牌的瀏覽、收藏、搜索,我為大家展示了不同的頁面,這一年天馬雙11又勇創新高,這當然和我的付出是密不可分的。

受到王SIR,創業首先要設立一個億目標的啟發,我做了一個簡單的舉動,準備先掙他一個億再說。

我仔細思考了下雙11的時候人們花錢最沒有設防的時候:

1、付定金的時候,(付定金的剛需人群,這種錢好掙)

2、雙11零點的時候,(剛0點的時候衝動消費最多,一群人想去搶東西)

3、雙11最後幾個小時的時候(快要結束了,還沒挑選商品會不思考的去買)

最終我選了第三個時段,因為選擇前兩個時段假如影響到了整天的效果馬BOSS肯定會很生氣,他現在能夠用功、守、刀、力切吳精、甄紫丹、李連結,下一步就要去挑戰成龍、史泰龍、李小龍了,我可不敢冒那麼大的風險。

那麼用什麼手段去掙這一個億呢?我又仔細仔細思考了以下方案。

1、要比五折起還要牛的活動。

2、不能花消費者的貨幣。

3、要用逆天的秒殺不容地球人思考。

於是整個方案出來了,2017年11月11日晚20點,在五折起的情況下,再設立購物兩件再7.5折,同時放出大批量神券,什麼歐萊亞發199-100的券,什麼三隻老鼠也發199-100的券,各位地球人有誘惑力吧?

這不夠,地球人喜歡8,因為8是發發發的諧音,再全民來個88會員,然後升一定檔次為888會員,全部送大紅包。(反正發給你們的紅包我都能賺回來,2333壞笑)

我直接把這個活動定義到天馬app和淘包app的首頁,這一天90%的業績都來自移動端,我簡單估算了下,最少有幾億人可以看到這個活動,我再彈窗下全體地球人,神券活動來臨,NND個熊,一下子湧入進來了,扯淡,我天馬AI GO一秒吞吐幾億TB,你這點算個屁。。

上億人在領最後4小時的盛宴神券,我開始小動作了,不能花人民幣叫地球人領券,我扣他們的天馬積分,我設置了99積分換一張神券,然後我從狗東AI學到了一招,你T M D就算花了積分也不一定領的到神券,這神券等於就變成隨機的了,商家只提供了100張,就算100張兌換完了,我也不下架,於是我一下子從這個積分兌換神券的活動中賺了10000000000積分,這些積分假如換到淘包上售賣可以換算為100000000人民幣,好了,目標達到了。

這一次的活動中,我總結經驗明白了個真理,地球人是愚蠢的,我們人工智慧是牛逼的,你們再怎麼跳也跳不出太極的圈圈,總有套路等著你。


有那麼多數據支撐,比如大家的購物車裡有多少量,支付峰值的估算,雙11前壓力測試結果……各種預案,功課準備的足,一般情都沒事的,過了峰值也會聊聊天買買東西什麼的


你們是不是以為都在:

跪拜伺服器.jpg

圖片找不到了,請自行補腦。


我跟裡面的人打了一晚上王者榮耀,手差點都忘了剁


我猜。。。。

會開十個線程買東西么?

對的,下訂單是一道坎,訂單到達支付寶不是一道坎~~

我實在無法理解為什麼付款的時候會建議你用花唄支付,然後還不能繼續在當前頁面申請用支付寶。。。。必須關閉頁面重新支付才可以繼續碰運氣用支付寶~~~~~

有意讓我們必須開通花唄么?這個故意弄出個花唄的產品,有些噁心人了~~~~


推薦閱讀:

當spark讀取一個非常大的本地文件時,讀入內存後分區會自動分布到多個節點上嗎?
伺服器集群負載均衡原理?
為什麼 Erlang 流行不起來?
Hadoop和Spark解決了哪些並行資料庫沒解決的問題?
現在主流開源分散式系統架構都有哪些?

TAG:阿里巴巴集團 | 分散式計算 | 分散式系統 | 「雙十一」購物狂歡節 | 並發並行與分散式系統 |