訪談 | 在LinkedIn做data scientist是一種怎樣的體驗?
數據科學是近五年來在美國迅速發展的熱門領域。2016年最新的Glassdoor排名顯示,數據科學家是美國最好的工作,因為機會充足、待遇優厚、以及巨大的社會需求量。
(圖片來源:Glassdoor)
這個行業為什麼這麼火,數據科學家又為何有如此大的社會需求量呢?
面向用戶的產品,尤其互聯網產品,每分每秒都記錄著無數用戶的使用信息。從界面瀏覽到內容點擊,任何微小的行為都以數據的形式被一一記錄下來。傳統分析方法已然無法解讀如此龐大的數據,數據科學應運而生,用於有效地反饋用戶對產品的理解,以及產品是否滿足了用戶需求。
簡而言之,數據就是用戶的聲音,數據科學的精妙之處在於對用戶行為提出最科學的解釋,為產品改進提供最準確的指導方向。因此矽谷科技公司都非常重視數據科學家這個新興的行業。
數據科學家的工作是怎樣的,在產品團隊中又是如何發揮作用的?我們採訪了一位LinkedIn資深數據科學家,請他來分享一下自己的心得體會。
Q:作為一名數據科學家,你具體擔當什麼樣的角色?
A: LinkedIn的數據科學家主要有兩種,一種是做模型,通過構建模型把數據運用到產品的「生產」。另一種做產品分析,通過對數據的分析推動精準高效的產品決策。我屬於後者,致力於創造更好的數據驅動型產品。
要理解我工作的內容,我們先來具體了解一下整個產品的流程。一個產品的開發周期會經歷構想、設計、開發、測試、上線五個階段。上線之後在新的用戶反饋基礎上建立新的構想,繼而形成一個產品升級的循環。
(圖片來源:Product Development | FSSCA)
數據科學家在每個環節都會參與並有不同的分工。比如在構想環節,要提出假設和問題。在設計環節要從全局的角度建立一套評價標準,例如產品從上線到推廣要達到哪些要求。在產品研發階段,要參與到數據追蹤,獲取、記錄、存儲、轉化用戶的數據,致力於怎樣更好地反映各個指標。在測試的過程中,數據科學家的參與度更高,要及時從A/Btest中提取有用的信息進行改進,保證用戶滿意度從各個指標來反映都能夠達到預期。產品上線之後要持續關注產品的發展,以及用戶的使用和滿意度。在這個階段可以產生許多新的改進的想法,進入到下一個循環。
Q:一個典型的LinkedIn產品團隊的構成是怎樣的?
A: 互聯網行業的工作形式和傳統行業很不一樣。傳統行業大多是分層的,比如CEO管理幾個VP,VP管理幾個總監,總監再管理手下的人。手下的人大多做的是流水線工作,並沒有決定權,決定權都來自上層。
而在互聯網公司,由於做的都是針對用戶的產品,一線工作崗位的人會對用戶更了解,對用戶的需求和反饋更明確。奮戰在產品一線的小團隊擁有充分的決定權,可以快速捕捉到產品需求的最新動向。
LinkedIn的產品團隊構成也是如此:首先會有一個核心——產品經理,任何決策都會通過產品經理來表達。圍繞產品經理,有搭建產品功能的工程師團隊,包括前端和後端的開發工程師;有測試工程師,主要測試產品的可靠程度、用戶體驗;有分析團隊,也就是數據科學家;有用戶體驗設計師,設計令用戶感到舒適愉悅的產品交互;還有運營,討論產品的決策和發展方向。這就是一個團隊的大致組成。
Q:你們的團隊氛圍怎麼樣?
A: 團隊氛圍非常好,因為並沒有一個人有絕對的話語權,在產品的開發過程中,大家都會參與到討論中,從需求出發討論我們要做怎樣的產品。這個需求可能來自方方面面,可能是用戶的直接反饋,可能是產品經理敏銳的直覺,可能來自於工程師開發的過程,也可能來自於數據科學家從用戶的行為中得到的反饋。
Q:數據科學家平時都用哪些工具?
A: 簡單分析數據最常用的是SQL,它的優勢在於十分便捷。複雜的數據獲取和分析通常需要組合工具,構建pipeline,在此不一一列舉。此外經常還會用到Pig, Spark, Presto, R, Python, 以及各種機器學習工具。每個人的背景知識和擅長領域都不同,往往會選擇對於自己最高效的組合工具。必須特彆強調一點,工具只是獲取和分析數據的手段,而基於對數據和產品的理解產生的嚴密而精準的邏輯,才是數據科學家最最核心技能。
Q: 你對數據科學這個行業未來的前景有什麼看法?
A: 我認為這個行業會一直火下去。產品的數據量一直呈指數型上升,即使是傳統的行業也朝著數據量化和多維度化的方向發展,傳統的數據分析方式已經沒有辦法適應現在的新情況。只有通過研發、優化數據科學的工具,並且在數據科學家的指導下把這些數據進行轉化,才能使數據成為能夠指導產品研發的方式。
Q:說說有趣的事情。LinkedIn有什麼特別的文化和活動?
A: 從小的活動說起,我們的團隊非常友愛,團隊的一個角落有台電視機,工作之餘一起打遊戲、聊天是大家日常消遣的一部分。周末會不定期地組織划船、爬山、燒烤等等。在節日或者同事生日的時候,常常有一些特別的活動和驚喜。即使是開會也可以既高效又輕鬆,有時候同事會給大家帶來甜甜圈,一邊開會一邊吃。
In Day是LinkedIn比較有特色的文化之一,每個月會有一天,這天大家可以做工作之外想做的任何事情,甚至可以用來休息和睡覺。不過公司會鼓勵大家投入到豐富的活動中。每個In Day會有不同的主題,比如回饋社會,組織一些公益活動;或者健康主題,組織大家去馬拉松長跑。
Q:聽說LinkedIn的伙食在灣區數一數二?
A: 伙食確實不錯,每天都有中國、美國、印度、墨西哥等世界各地的菜系供選擇。公司非常注重員工福利,由於中國員工比較多,還特地請來幾位廣東大廚。早飯有種類豐富的粥,可以加油條、皮蛋等各種食材。
寫在最後
從採訪中小編受益匪淺。和喜歡的團隊一起做喜歡的工作是一件幸福的事。這種幸福不僅來自於公司對員工的人文關懷,也來自於團隊成員之間的互相信任。祝各位小夥伴在數據科學家求職道路上一帆風順。
八小時內如何熟練掌握Tensorflow,成為深度學習高手?Google Search特約教師,全球華語首發,揭開秘訣!
點擊鏈接,立即註冊免費第一節課。Welcome! You are invited to join a webinar: DS401 深度學習TensorFlow 第一堂課. After registering, you will receive a confirmation email about joining the event.
本文作者:Iris Gao
著作權歸作者所有。商業轉載請聯繫作者獲得授權,非商業轉載請註明出處。
更多精彩,盡在矽谷高端線上教育社區BitTiger:請猛戳我
公眾號:論碼農的自我修養 或 搜索「bit_tiger」 (回復career獲取原創程序員求職指南)
知乎專欄:太閣實驗室
微博:@太閣BitTiger
今日頭條:太閣BitTiger
推薦閱讀:
※簡歷中應該提自己完成的MOOC課程么?
※網易雲課堂的產品經理微專業怎麼樣?
※HR在面試中到到底起多大作用?
※多個offer怎麼選?6個維度教你選擇職業機會(附評估表)