標籤:

一個數據分析師的養成

前言

本文是洋蔥數學數據分析實習生丁寧童鞋的實習總結(有刪節)。這位童鞋是應用統計專業的應屆碩士生,之前沒有企業數據分析實習的經驗。文中他分享了自己在洋蔥數學做數據分析工作的體會。

我覺得這份總結令人印象深刻的是他將自己的真心話說了出來,而不是通過樣板化的東西來搪塞。特別是他對數據分析這份工作的日常內容、能力技術要求等部分都讓我感到十分親切真實。所以我徵得他的許可,把這份總結分享出來,與各位共勉。

同時,也祝他未來一切順利。

---


此總結分為三部分:日常工作,職業認識,自我認知

日常工作

日常工作包含數據需求,指標制定,埋點設計,數倉實測

  • 數據需求
    • 散需求
    • 迭代需求(v5.5 / v5.6 迭代需求)
  • 指標制定
    • 運營線核心指標及口徑
      • 數據:經與運營線協商製作其關注的核心指標
      • 目的:統一數據口徑,制定完整的運營線核心指標,滿足運營線日常數據監控
    • 產品一級指標及口徑
      • 數據:
        • 新老用戶
        • 首次付費用戶
        • 續費用戶
      • 目的:統一數據口徑,通過數據對相應指標進行驗證後制定完整的產品一級指標,滿足日常數據監控、預測
  • 埋點設計
    • 設計流程:兩周一個 sprint
      • 第一周:進行產品交互評審,提出埋點想法 -> PM產出prd,開始設計埋點 -> 產出埋點文檔
      • 第二周:需求評審會,判斷埋點是否滿足產品需求,是否具有開發可行性
    • 設計對象:
      • 任務體系優化埋點設計
      • 註冊流程優化埋點設計
    • 設計目的:滿足分析需求,連接數據與產品為日後分析工作做好充足準備
  • 數倉實測
    • 數倉定義:通過整合不同結構/類型的數據源為統一的結構,滿足查詢的需求
    • 測試目的:
      • 數倉開發結果與取數方法一致性:數倉相關表的數據是否與源數據或使用源數據進行計算後的結果一致
      • 數倉開發滿足產品業務需求:事實表主要關注統計方向
    • 測試方法:
      • 表設計驗證:欄位名、欄位數量、欄位類型
      • 欄位數據驗證
    • 測試表:
      • 事實表
      • 維度表

職業認識

「數據分析師」這個職位在我真正接觸之前,一直覺得這應該是一個技術型工種——需要會 SQL ,R ,python ,需要了解資料庫原理。但當我真正接手工作之後,發現它遠遠不止這些。

通過日常的工作,以我淺見,一個專業的數據分析師,需要具備以下四大能力

  • 溝通表達能力

數據分析師從來都不是從屬於某一個特定分類的職位,它遊走於開發,產品,運營之間,數據需求對接時需要與產品經理溝通,數據產出分析後也要對產品經理進行交付溝通,埋點設計需要與開發對接,而產品的各種指標建立是為了更好的監控產品日常數據,與運營的溝通也是不可避免的,而想要進行有效的溝通,能夠將自己的意思清楚的傳達給對方——也就是表達能力,是不可或缺的。沒有溝通,就沒有統一的數據口徑,沒有溝通,就不知道設計出來的埋點和指標是不是業務真正需要的。所以說,溝通表達能力是一個數據分析師必須具備的能力。

  • 認知理解能力

認知理解能力,不是單一的對某一條業務線的理解,而是一種從大到小,自上而下的認知理解能力,從對整個行業狀況的認知,到對公司業務模式的認知,再到對產品設計邏輯的理解。它可以幫助你在對接數據需求不僅僅是被動地接受產品經理提供的口徑,而是針對具體業務對需求進行分析,與產品經理協商共同制定對方想要數據或者是想通過數據分析得出的結論,畢竟產品經理的角度可能和數據分析師所看的角度不同;相似的,產品或業務線的指標更需要對其,甚至是對整個行業有更高要求對認知理解能力。所以,認知理解能力,是一名真正的數據分析師所要具備的能力之一。

  • 數據分析能力

這其實也是我之前認為數據分析最重要的能力,現在看來,這雖然不是數據分析師唯一應有的能力,但絕非是不重要的能力。相反,它決定了你是否能成為一名優秀的數據分析師。我覺得,數據分析師的分析能力,要從兩方面來講。

一方面,在現在日常工作中,我所接觸數據分析工作的難度變化主要體現在 sql 的難易程度,但我覺得一個真正的分析師在某些較為複雜的需求下,還應該在跑出數據後使用有效合理的分析統計方法得出一個科學而匹配的結論,excel 是一種簡單的途徑,而R,Python 或者 spss 也應該作為一個分析師處理數據的方式,畢竟 excel 還是有一定局限性的——比如假設檢驗,相關性分析(ps. 也可能是我 excel 用得太菜了。。那些功能我只在那些軟體裡面見到過)。而在進行結論總結時,數據可視化也是一個重要的手段。

另一方面,對得出的數據,使用的分析統計方法是基於之前的認知理解能力,只有對業務模式和產品邏輯足夠了解,才能使用合適對方法進行分析,而這種了解,不僅僅要依靠自己的認知理解能力,還要有深耕一線的經驗。

以上兩方面分析能力,我稱之為硬軟兩種能力,硬能力也就是軟體操作及統計方法掌握能力,軟能力,就是產品業務理解經驗能力,軟硬結合,才能真正成為數據分析師所需要的數據分析能力

  • 項目把控能力

之前講了,數據分析師這個職位是遊走於開發,產品,運營之間的角色,也就是說,往往一個分析項目成立所需要的角色是多種多樣的,而數據分析師基本上在項目的每個環節都是要有參與的,這就需要數據分析師對整個項目流程有一定對把控能力,而這種把控能力,具體來講就是對人員對把控和對時間的把控。項目涉及了什麼人,技術?產品?運營?如何安排接洽?項目進程的時間點如何安排,是否既能滿足自己的排班要求又能滿足需求方的工作要求,都考驗了對項目對把控能力,所以項目把控能力是一個高級數據分析師應具有的能力。

自我認知

3個月的實習,從一開始只會寫一些簡單的 SQL ,到對「數據分析師」這個職位有了一個自己對理解,這其中,有進步,也有不足,既然之前提到了數據分析師需要的四大能力,那我也就這四大能力來談談自我認知

  • 溝通表達能力:

大學時參加社團與辯論賽,研究生又干過新媒體運營,來公司之前我自認為溝通表達能力可以稱得上我的優勢了,但真正接觸工作後發現,自己在方面還是有很多不足的地方,工作中所需要的溝通表達,需要更高效的溝通效率,更清晰的表法方式。能在合適的時間,合適的場合,通過合適的表法方式,使溝通雙方能達到信息的有效傳遞或互換,以此來更好得完成工作,才是溝通表達能力的真正體現。就溝通能力還說,我雖是外向的性格,但時常有一種怕麻煩別人,覺得能自己解決就自己解決的心理,但其實這種心理在數據分析的工作中是不可取的,我們的工作需要與很多部門溝通協調,如果在接到需求後閉門造車,輕則工作效率大大降低,重則產出的數據不符合要求,不僅做了無用功,還耽誤項目進程。而表達能力一是需要對業務的理解,做到有話可講,二則是能夠將自己的理解通過語言或其他形式傳遞給他人使其能夠清晰了解自己的理解,做到有詞達意,在這方面我也一直在努力。

  • 業務理解能力:

目前來講,我對於業務的理解能力就是在於對業務模式以及產品邏輯對理解,業務是怎樣開展的,為什麼要這樣開展,產品設計的出發點是什麼,為了達成一個什麼樣的目的,把這些理清楚,在進行數據需求對接,統一數據口徑,進行數據分析時,才能夠時刻清楚自己到底是為了什麼目的,在幹什麼事。而這方面,我覺得通過對日常工作和各項會議的用心體察,仔細思考,是能夠慢慢提升自己對業務對理解的,也是我認為自己做的還不錯的一項。

  • 數據分析能力:

如果以一個可以量化的角度來分析我這3個月的進度,我覺得最大的進步應該是我的 SQL 技術了:)從簡單的,到複雜的,再到特別複雜的,隨著需求的難度增大,所寫 SQL 難度也是逐步攀升,這就對我的 SQL 是一個巨大的考驗,經受住了考驗也就有了巨大的提升。但誠如之前所說的,一個數據分析師的分析能力絕不僅僅應該是 SQL 的難易程度,分析工具的選取,分析方法的使用,分析結論的展現,都應該是一個數據分析師所要具備的素質,也是我今後要更加努力的方向。

  • 項目把控能力

日常工作中,作為一個實習生,更多的時候負責的是一個項目的某一個環節,但這並不意味著不需要項目的把控能力。雖然只是負責項目中的一環,但項目中的每個環節都不是孤立的,這就需要具有環顧整個項目的視野——理解項目從始至終的流程,清楚每個環節的負責人,了解項目環節的時間節點,只有這樣,雖然只是負責單一環節,但在此環節工作出現什麼問題後,可以以很快的效率處理問題,保證整個項目能順利進行。

這種項目視野的角度也是從工作中慢慢體會到的,剛開始來的時候只是單獨的負責某一個環節(跑數),但當遇到某些問題後,不知道如何解決只能向 Mentor 報告,但如果當時就有這樣一個對整個項目覆蓋的視野,就能很快對接合適的人員來解決問題。所以說,作為實習生,雖然不能對整個項目進行全面把控,但對於整個項目的視野角度,至關重要,也是為下一步能夠把控整個項目的重要鋪墊。

推薦閱讀:

七周數據分析師:第二周業務篇,有關業務思維的學習。
互聯網數據分析的思路、方法、數據來源和分析指標
0024數據處理:多選題錄入數據方式之間的轉換(多重分法和二分法的轉換)HLOOKUP和SEARCH函數的使用
這是一份數據分析求職指南--當我爬取拉勾、前程無憂、Boss直聘後
數據分析師需要學習什麼軟體

TAG:數據分析師 |