單日處理8.12億包裹,他是全球物流領域「最大數據」的科學家

如今,我們每個人都在談論「數據科學」,《哈佛商業評論》甚至將數據科學家定義為「21世紀最性感的職業」。在這個大數據時代,究竟什麼是數據科學?數據科學家又究竟是怎樣的一群人?他們在創造著什麼令人著迷的東西?DT君將在2018年走訪50位來自各行各業的頂尖數據科學家,希望能讓你們了解這些神奇的人和他們的神秘事兒,為你們一窺數據科學的未來與未知。

令人驚嘆的「菜鳥速度」

每年的天貓雙11購物節,都是一次「全民買買買」的狂歡。

家住上海嘉定區朱橋鎮的劉先生,早早就在自己的購物車裡添加了雀巢咖啡、餅乾、堅果等零食,希望能在雙11的時候第一時間搶到自己心儀的商品。11日0點剛過,他就立刻完成了付款。

4分鐘內,劉先生選購的商品被貼上了菜鳥電子面單,從倉庫中發出;12分18秒,包裹就已經被送到他家門口。當快遞員敲響劉先生的家門時,他甚至還在「血拚」。

從下單到簽收,菜鳥的物流體系只用了12分鐘就完成了商品的整個配送過程。「菜鳥速度」是如何做到這麼快的呢?菜鳥的數據掌舵人丁宏偉說,這是大數據的「預見」所帶來的力量。

換句話說,在劉先生下單前,菜鳥的大數據就已經能大概預估到他將要買什麼東西了。

「首先,我們會根據整個電商體系的流量情況,對商家行為和消費者行為建模,預測雙11每個城市每個社區對不同品類商品的需求。」丁宏偉告訴DT君。接下來,他們會把數據反饋給商家,輔助商家備貨,並根據需求把貨物配置在不同地區的倉庫中,做到 「單未下貨先行」。

作為國內物流大數據領域首屈一指的科學家,丁宏偉在這一領域已經了十多年了。2001年,他從清華大學碩士畢業,之後遠赴法國深造,在法國國家計算機研究院(INRIA)獲得了運籌學博士。在完成自己的研究生涯後,丁宏偉果斷從學界轉入工業界,在IBM工作了近10年,一直從事數據科學領域研究和物流供應鏈優化應用。2014年,他正式加入菜鳥,擔任首席數據科學家,領導菜鳥的大數據業務。

丁宏偉個子很高,為人謙和,談吐優雅,經常穿著一身休閑西裝。比起嚴肅的「科學家」稱謂,他看起來更像一個有豐富經驗的「業務Leader」:講起數據的話題時極接地氣,幾乎不會拽術語的、扯概念。

(圖片說明:菜鳥首席數據科學家丁宏偉接受DT君專訪)

「數據科學家,我認為它必須要具有行業屬性。因為數據的終極價值還是需要體現在和業務場景相結合的地方。」丁宏偉認為,一個好的數據科學家應該到行業中去理解業務並實現數據的價值。隨著互聯網的發展,各個行業的數據出現了井噴式的增長,這就給他們這些「數據科學家」提供了表演的舞台。

在領導菜鳥大數據之前,丁宏偉曾幫助行業領先企業規劃供應鏈網路,優化生產排程計劃,優化商業設施選址,常常需要綜合考慮生產數據、地理位置數據、門店數據、社區數據等多維數據。

今天,丁宏偉領導的菜鳥團隊面對數據量和數據維度都更加複雜——他們最高峰時要處理單日8.12億個包裹的所有動態數據,這可能是全球物流領域最「大」的數據了。

「雙11當天有8.12億個包裹,這些包裹在後續每一天都會發生多次的狀態變更,為了實現對這8億多個包裹的實時監控,我們需要對超過200億條數據進行實時去重、關聯、分析等操作。能實時高效處理和分析這樣量級的數據,我們感到非常驕傲的。」在回顧菜鳥在雙11的表現時,丁宏偉自豪地告訴DT君。

雙11獨特的業務場景其實只是菜鳥網路的一部分,丁宏偉說到,他計劃的智慧物流體系可不僅只是「快」而已。

雙11第一單背後的物流智慧

在廣東惠陽的菜鳥倉庫中,數千平方米的廠房,幾乎看不見什麼工作人員。

廣闊的空間里,上百個外形酷似掃地機器人的AGV(Automated Guided Vehicle,無人搬運車)正在有條不紊地將貨物搬來搬去。

(圖片說明:忙碌在廣東惠陽倉庫中的的菜鳥物流機器人)

AGV又被稱為無人搬運車,是一種自動化的無人駕駛機器人,被廣泛地應用在各個行業。倉儲業是AGV最早應用的場所。1954年世界上首台AGV在美國的南卡羅來納州的Mercury Motor Freight公司的倉庫內投入運營,用於實現出入庫貨物的自動搬運。目前,世界上約有幾十萬台各種各樣AGV運行在幾千座大大小小倉庫中。

「每個機器人,需要去把貨架頂起來,然後按照整個揀選優化或者檢驗順序給到分揀員,實現『貨找人』。這個過程中,它要對多智能體協同、路徑優化、圖像識別、避免碰撞等各種數據問題的進行綜合考量,從全局做出判斷,這是智能物流比較大的一個應用場景。」丁宏偉說到。

在丁宏偉看來,智能物流的「智能」本質在於:通過各種技術能力獲取全局的實時的高質量的各類物流要素的數據信息,來進行更合理更優化的決策。

大數據的「大」就在於一個「全局性」的把握。

菜鳥要把握的「全局」不僅在於自動化的機器人倉庫,它更看重在整個物流供應鏈上的全局優化。「這也是菜鳥平台的特性所在。」丁宏偉強調。

「因為每一個物流合作夥伴,其實都是整個物流鏈路里重要一環。物流之所以難,是因為它的鏈路特別長,跨越很多公司,也在地域上有很大的跨度,所以它的數據獲取和分析都面臨很大困難。」丁宏偉認為,作為一個數據平台,菜鳥在連接了各方合作夥伴後,能夠站在全局的角度,為每個物流鏈條上的角色提供建議。

通過融合運籌學上的混合整數規劃、線性規劃,以及大數據領域的機器學習、深度學習等方法,他從發貨、攬收、倉儲、配送等環節對物流體系進行優化,降低服務成本,提高效率。同時,再結合消費數據、地理位置數據等,又能夠對消費者的行為進行分析預測,從而反哺、指導商家的物流行為。

丁宏偉說,之前很多商家在做線上、線下的銷售時,使用的是兩個獨立的渠道,管理效率較低。在智能物流模式下,他們能將線上和線下的數據和流程全部打通,讓商家可以看到全網的庫存、銷售等情況。「然後,我們幫助商家進行倉庫配置,在不同層級的倉庫大概備多少貨,我們會基於這些數據,幫商家把他的貨品一路往下沉,根據不同的地區、不同的需求,把它存在不同的層次。」通過對全局的把控,在不影響銷售的情況下,他們曾幫助客戶降低了38%的庫存量。

正是有了這種全局的數據能力,菜鳥才能幫助物流合作夥伴在12分鐘內把快遞送到上海的劉先生家中。不過丁宏偉也強調,電子面單這樣的基本信息化服務依然非常重要,因為物流數據的信息化是智能物流的基礎要求。

大數據和AI:滅舊與創新

如果你行走在杭州的阿里園區里,你會不時看到一個外形酷似《星球大戰》中R2D2的機器人,帶著快遞,來回穿梭在樓宇和商店間。它碰到行人會避開,能夠自己坐電梯,十分智能。

(圖片說明:2017年6月13日,杭州,菜鳥智能配送機器人小G在杭州鐵路運輸法院辦事大廳忙著配送文件;圖片來源:視覺中國)

這是菜鳥網路設計的末端配送機器人小G,它能夠自主完成快遞的「最後一公里」,將包裹送到收件人的面前。

小G是菜鳥應用圖像識別、深度學習等人工智慧技術設計出來的智能機械產品。除此之外,在上文提到的機器人倉庫里,包括AGV機器人、機械臂等,菜鳥已經在物流領域的各個鏈條上開始大量使用人工智慧和機器人技術了。

一方面,機器人能夠極大減輕人類的勞動強度,提升工作效率;但是另一方面,一些原本屬於人類的工作,可能會被機器人所「搶」走。

對此,丁宏偉認為,我們不用太過擔心。「蒸汽機出現的時候,很多紡紗工人看似失業了,但實際並沒有,他們會演進成為蒸汽機的操作工人。」丁宏偉以歷史上的工業革命為例,認為人工智慧的出現雖然會影響到一些特定崗位,但是也會創造很多新的崗位,整體上人工智慧還是會推動行業的進步。「AI讓我們效率更高、成就感更好,整個體系更有價值,所以我們應該樂觀地看待它。」

丁宏偉認為,AI和大數據不僅不會威脅到人類員工,還能一定程度上幫助他們。

快遞員是物流行業中普通人接觸最多的群體,他們的工作強度很高,不管颳風下雨,每天都要去送快遞,基本全年無休,備受挑戰。「快遞員是很辛苦的一群人」,丁宏偉認真地說。由於壓力大,快遞員的流動率非常高,很多人常常做不到半年就離開了。如何改變快遞員這種情況呢?丁宏偉認為,大數據可以在其中做很多事情。

這其中的關鍵,就是信用——大數據可以幫助人們建立信用體系。缺乏信用就會增加社會體系的交易成本和運行成本,影響生活體驗。

丁宏偉介紹說,在流動性強的物流行業中,快遞員普遍缺乏一個回饋機制,也就是沒有所謂的「信用」數據。一個快遞員的服務體驗好、工作能力強等特質並不能給他們帶來更高的收入和更穩定的工作,其中缺失的重要一環就是「信用」。

「讓服務好、能力強的快遞員,有一套數據在背後支撐他,讓他們工作得體面,在行業里走得更好更遠。」一套好的評價機制和一個良性循環的職業環境,才能為從業者提供最貼心的保障。這也是菜鳥網路正在做的。

一路走來,丁宏偉面對的數據量越來越大,維度越來越複雜;但是不變的是,他始終從場景出發,秉承自己數據科學家的理念。

採訪結束後,DT君不免有所感慨,中國在電子商務領域的全球領先性和規模效應催生了大數據在物流領域的應用與發展,雖然,人類離完全的人工智慧時代還有很遠的路要走,但似乎也已經看到了智能物流正在朝我們走來,這背後絕然離不開數據科學力量的支撐。

文 | 程一祥: chengyixiang@dtcj.com

題圖 | 視覺中國

期待更多數據俠乾貨分享、話題討論、福利發放?在公眾號DT數據俠(ID:DTdatahero)後台回復「數據社群」,可申請加入DT數據社群。

關於數據科學50人

數據科技50人項目是DT財經旗下數據俠計劃重點內容產品,旨在與數據科學領域KOL共同挖掘數據內容的價值。我們從商業數據科學領域選出最具代表性的50位先鋒進行深度專訪,50人由DT財經獨立評審並發布,第一財經數據科技及合作夥伴傾力支持。

往期回顧:

+ 他可能是中國最極客的營銷專家 | 數據科學50人·王煉

+ 無數學不數據,一場16年的堅守 | 數據科學50人·宣曉華

數據俠門派

本文數據俠丁宏偉,清華大學碩士,法國國家計算機研究院(INRIA)運籌學博士。曾在IBM工作了近10年,從事數據科學領域研究和物流供應鏈優化應用。2014年正式加入菜鳥,擔任首席數據科學家,領導菜鳥的大數據業務。

加入數據俠

「數據俠計劃」是由第一財經旗下DT財經發起的數據社群,包含數據俠專欄、數據俠實驗室系列活動和數據俠聯盟,旨在聚集大數據領域精英,共同挖掘數據價值。了解數據俠計劃詳情請回復「數據俠計劃」,投稿、合作請聯繫datahero@dtcj.com。


推薦閱讀:

將Uber的眾包模式從客運移植到貨運,有哪些障礙,需要進行哪些調整?
物流這兩字,怎麼就高端不起來呢?
拼多多商家因為被判虛假髮貨而被平台罰款怎麼辦?
呷哺呷哺的供應鏈是怎樣的?
作為一個第三方物流公司運輸專員需要重點關注哪些方面?

TAG:物流 | 数据科学家 | 大数据 |