人人都是數據科學家?Airbnb數據大學開課了

前言

大數據的熱潮決定了運用數據是有競爭優勢的,一向具有前瞻意識的Airbnb這一次打算走得更遠——自己的數據大學。通過他的數據大學計劃我們得以一窺Airbnb全球快速增長背後的秘密,而這是否也意味著公司內部完善的數據教育會替代在線數據教育成為未來的新趨勢呢?


Airbnb一直十分看重數據,認為數據代表著用戶的聲音,因此在工作和決策思維都以數據為導向。在Airbnb里,數據科學如同翻譯員,他們注重使用統計數據去了解用戶,並把它轉換成人或機器能理解的聲音。同時,Airbnb還利用定量與定性(例如,個人用戶研究)相結合的方法,幫助企業以及社區的成員做出儘可能最好的決策。

目前,Airbnb建立了一個近100人世界級的數據科學團隊,從實驗到數據分析與可視化、建模和機器學習等各個方面都相當在行,不僅建立了一個穩定的、可靠的和可擴展的數據基礎設施來作為數據基礎,還創建了一組強大的數據工具套來輔助全Airbnb的數據科學家和知識工作者。

  • Apache Airflow —?數據工作流管理平台
  • Apache Superset ?—?數據可視化和訪問
  • ERF —?實驗報告的A / B測試框架
  • Dataportal —?數據搜索、探測和信任
  • Knowledge Repo —??知識和見解量化

數據科學全民化

Airbnb另一個基本信念是,每個員工都應該有權在知情數據的情況下作出決定。這適用於Airbnb下所有組織,從是否推出新產品的到分析如何提供最好的員工經驗。Airbnb的數據科學團隊一如既往地貫徹使整個公司了解和使用數據的目標和宗旨,希望能夠堅持在數據的驅動幫助下制定決策。然而,想要每個房間都有一個數據科學家是不可能的,因此Airbnb決定把數據相關技能拓展出去。

此外,Airbnb迅猛的全球增長態勢讓這一切更有挑戰性。Airbnb從2011年的只有三藩市一個辦事處擴展到時至今日的全球22個國際辦事處,其中許多辦事處沒有數據科學的存在,與此同時,人本身有批判性思維能力並對數據獨立思考,因此,Airbnb另闢蹊徑,決定賦予人們這些數據分析的能力。

為了應對這一挑戰,Airbnb在2016的下半年著重思考了民主化科學數據和量化數據知情決策。當中,他們使用了一部分自身平台的周活躍用戶(西澳大利亞)作為基準線來展示在數據輔助下一個組織的運作。在2016年的開始,只有大約30%的Airbnb員工是數據平台的周活躍用戶,這顯著低於其他飛速發展的互聯網公司同行,比如facebook和Dropbox。

接著,Airbnb開始思考是什麼阻礙了公司查看自己的數據。

數據知情決策所需的關鍵要素包括對數據的可訪問性、對數據工具的理解以及如何利用數據和工具的專業知識。Airbnb內部人員觀察發現,縮放數據明智的決定實際上是對用戶數據教育的瓶頸。實際上,數據工具很好地為數據科學家服務。同時,Airbnb已經使數據更易於訪問的核心數據通過努力取得了巨大的進步,單一產品數據源的真相,以及SQL實驗室,Airbnb建成一個新的SQL編輯器的超集。但差距在於沒有任何正式的程序來讓員工掌握使用我們的工具以及如何處理核心數據的知識。

在綜合考慮後,Airbnb決定創建一所數據大學。


解決之道:數據大學

數據大學是根據每個員工在Airbnb的團隊與角色進行不同數據教育的。Airbnb的願景是讓每一位員工都能做出數據知情的決定。不同於提供數據教育的組織只關注他們的技術員工,Airbnb的做法別出心裁。在Airbnb看來,每個人在公司內都應該而且能夠利用數據在他/她的角色做出更好的決策。因此,Airbnb設計了一個任何人都可以訪問的程序。

創造「公民的數據科學家」是大有裨益的?——不僅有助於確保決策是基於數據的,並且使人們更加自主。這點很重要,因為問問題的人總是最了解問題背景的,當他們自己回答時會減少了需要的反饋流程。這也有助於節省一些數據科學團隊的時間。Airbnb曾考慮利用現有的資源比如MOOCs等,但是公司內的很多數據工具是獨特的,也相信在Airbnb的數據環境下教育更有價值。


數據大學課程設置

課程由30多個班級組成,涉及不同的主題。100-級別的課程系列提供了數據知情決策的基礎知識,向Airbnb的所有人開放。200-級別的課程系列為人們提供了使用SQL訪問數據的應用技能,或者在Airbnb的數據中使用Superset、Tableau和ERF等工具對數據進行分析和可視化。然後,300級系列主要針對工程師和數據科學家。它使人們接觸到先進的數據技術,如機器學習和用於編寫數據管道(pipelines)的一類工具,比如airflow。課程還囊括目前流行的各種語言,如R,Python和Hive來分析和處理數據。


數據大學師資團隊

最初的很多課程由Erin Coffman開發和講授,他在Airbnb是的最資深的數據科學家。然而,從那時起,Airbnb已經積累了超過30名來自數據科學和工程組織的志願教職人員,他們幫助創建課程內容以及教授課程。


影響:民主化的數據科學

目前,數據大學在Airbnb已經取得了巨大的成功。今年上半年以來,超過500人參加了至少一門課程的學習(約Airbnb整個的1 /8)。參與的深度很高,每個參加過的員工平均參加了4個以上的班級,Airbnb總共有2100多個「在座位上的屁股」(「butts in seats」)。到目前為止,每個班級的NPS評分都是+55或更高。

此外,它完全改變了Airbnb的數據文化,有45%的Airbnb員工成為了數據平台的周活躍用戶(WAU)。以前需要由專業數據科學家或分析師處理的Ad-hoc數據,現在通常由從數據大學畢業的員工自行處理。Airbnb經常聽到關於員工使用數據的趣聞軼事,從招聘人員到產品經理編寫他們自己的SQL,並解釋他們自己的實驗。最近,Airbnb已經開始將項目擴展到其他辦公室,包括都柏林、波特蘭、新加坡和首爾。


展望未來

Airbnb的團隊確實對數據大學的最初結果感到鼓舞,公司將繼續更新課程內容和擴大課程的廣度(300-級別系列是下一步)和增加課程設置的地點,除此之外,Airbnb還將嘗試使用不同的學習格式,例如在線或流式課程。

在分享經驗時,Airbnb希望能夠啟發其他組織致力於解決公司正在嘗試解決的規模和數據民主化問題、分享經驗,用合作的方式與員工、客戶和合作企業共創未來。


全文翻譯自Airbnb公司的Jeff Feng, Erin Coffman & Elena Grewal發布在medium上的博客How Airbnb Democratizes Data Science With Data University


一切以數據說話,成為當今或者未來互聯網發展的趨勢,具有優秀數據分析和數據可視化能力的人將在勞動力市場中具有很高的競爭力。DataGirls每月在北京舉辦線下的Tableau周末集訓營,為對數據可視化感興趣的零基礎人群提供紮實、快速而系統的學習機會,欲了解更多集訓營情況,可跳轉至:【DataGirls-Tableau專場03期】用Tableau成就你的商業數據分析師之路

(PS:Tableau是目前商業數據分析領域中最流行的可視化工具。它是一款幫助公司及其管理者更好地理解數據信息的商業智能軟體。)


如果想了解更多數據分析和數據可視化的相關信息,可以關注微信公眾號:DataGirls

如果大家有關於更多相關問題,可以邀請DataGirls回答~


推薦閱讀:

沫小姐學數據分析之Python入門篇
數據篇(1):數據分析
就是它了-結合自己興趣與事業發展的新方向
基於新浪微博的男女性擇偶觀數據分析
R語言實戰第八章:回歸

TAG:數據分析 | 數據可視化 | DataVisualization |