「我想做數據分析師,你覺得我能行嗎?」
可能是因為又到了金三銀四的跳槽好時節,最近我經常被人問到一個問題:
「我想轉做數據分析師,但是@#$%^*)*(^,你覺得我能行嗎?」
「但是」後面的內容通常可能是「我不會寫SQL」,「我不懂大數據」,「我只會基本的EXCEL」,「我沒有相關經驗」等等,總的來說都是對成為數據分析師這件事滿懷期待又怕受傷害,因為缺乏了解。
今天就來說說,怎麼判斷自己到底能不能、適不適合做一名數據分析師。
數據分析師的能力模型
近期的一次工作彙報里需要對自己做一個簡單評價,我總結了自己理解的數據分析師的能力模型,然後回顧了入行時和現在的自己,用下圖作為了自我評價。
我的意思並不是說,你也需要有這樣的能力分布模型,才能夠入行成為一名數據分析師。
這裡我想先舉一個例子。如果經常喝咖啡的人,可能會知道,不同種類的咖啡其實本質上就是濃縮咖啡、牛奶、奶泡、水、奶油等這些主要成分以不同比例搭配而成。
我想說的是,數據分析師其實也和咖啡一樣,世界上並非只有一種數據分析師。
當我們把天賦點加在不同的技能分支上時,我們會得到各種型號各種款式的數據分析師。
常見數據分析師類型
簡單列舉我熟悉的幾種吧。
這是我見過的最多的數據分析師,又名數據開發工程師,通俗地說就是主要寫SQL的程序員。日常主要工作就是根據需求進行數據查詢或者完成數據報表的開發。
也有一些數據分析師,幾乎不需要寫SQL,也極少接觸資料庫。主要使用的數據工具是EXCEL。依據對業務的熟悉與深刻理解,完成業務相關的數據分析和經營管理,我們通常稱之為業務分析師。
這類分析師,他們不參與數據的生產和處理過程,主要工作是圍繞一個個專題性研究,從上游數據方獲取所需的數據結果,然後通過高超的可視化和報告撰寫功力,產出一份份高質量的數據報告。
這是我想成為的數據分析師。
有數據查詢和提取的基礎能力;基於對業務的理解,能夠圍繞業務構建相應的數據體系;對數據的動態變化進行有效識別和解讀;通過挖掘數據的內在含義,有針對性地通過技術手段和商業分析思維定位問題點並找到解決方案;並能夠最終推動落地,實現業務的增長。
基於此長期目標,我也會對以上各個方面的能力和涉及的知識進行深入學習,持續性地沉澱和輸出自己的學習結果,歡迎大家長期關注和指導。
我零基礎,能成為數據分析師嗎
以上,相信你也發現了,不管你的興趣或者專長在哪個面向,都不會阻礙你成為一名數據分析師。
同時,你應該也發現了,不管哪一種數據分析師,首先你都需要有一件得心應手的兵器——也就是我們說的數據工具。它可以是最常用的SQL/HQL,是PYTHON、R、SPSS,甚至EXCEL也可以。無論哪種,總之你不可以赤手空拳上陣。
這時有人會問了,那我現在什麼工具也不會,怎麼辦?
不必擔心,其實就像兵器可以花錢輕易買到一樣,這些數據工具只要你付出一些些的時間和精力為代價,正常人少則一兩天,多則一兩周都能達到入門級別。
除了工具之外,數據分析師不可或缺的另一點是——邏輯思維。邏輯思維是你成為數據分析師的最根本的基點。
學習包括查詢語言在內的任何編程語言都需要良好的邏輯思維,對業務的理解、和需求方的有效溝通需要清晰的邏輯,分析思路和報告的撰寫就更不用說了,都是建立在邏輯之上的上層產物。
雖然說,就像數據工具可以學習一樣,邏輯思維也是可以培養的,但是後者的難度和前者完全沒有可比性。這也是為什麼我們可能經常會招聘一個邏輯思維極強但是完全不會寫SQL或者不會用EXCEL的人,也不願意招聘一個SQL寫的很好EXCEL玩的很溜但是邏輯思維不過關的人。
所以,要成為數據分析師,最重要的能力是——邏輯思維。
邏輯思維到底是什麼?
那如何判斷邏輯思維到底O不OK呢?我們再來舉個例子。
著名表演藝術家宋丹丹老師曾經在小品中問過這樣一個問題:
「要把大象裝冰箱,攏共分幾步?」
如果這是你的面試問題,你會怎麼回答呢?我隨便想了幾個也許你會回答的答案。
0分邏輯
沒法裝/就直接裝進去唄。
1分邏輯
第一步,把冰箱門打開;
第二步,把大象裝進去;
第三步,把冰箱門關上。
2分邏輯
第一步,測量大象的大小;
第二步,找一個足夠大的冰箱;第三步,把大象裝進去。
3分邏輯
第一步,首先確定大象的體型,是否是普通冰箱能夠容納的,如果可以,那麼就裝進去;
如果不是普通冰箱能夠容納,那麼需要進一步確認是否要求大象必須完整並存活狀態下裝進,如果不要求,那麼可以將大象切塊,然後分塊裝入足夠多的冰箱中;如果要求大象完整並且存活狀態,那就製造一個能夠容納大象的巨型冰箱。以上。
其實這類問題的答案就像我們小時候做寒暑假作業裡面閱讀題的答案一樣——「言之有理即可」,並沒有標準答案,主要是考察你面對一個問題時,理解、分析和解決問題的思路。
0分邏輯的答案,直接是沒有思路或者是無法將一個抽象問題拆解成幾個具體的細分問題。
1分邏輯的答案,雖然說出了一二三,但只是有拆解問題的「形」,並沒有抓到問題的關鍵點。
2分邏輯的答案,點出了這個問題的兩個關鍵實體——大象和冰箱,並給出了一種方案。
3分邏輯的答案,以大象為主體出發,逐一分析了問題的各種可能性,然後針對各種可能性給出了相應的方案。
以上幾個答案舉例,我並不是說一定要給出一個方案才算對。即使是你認為「沒有辦法裝進去」,但只要給出充分的理由,比如「正常一隻大象的肩高3-4米,體重2-8噸,而普通的冰箱容積最大也不過幾立方米,無法容納一頭大象。」也不失為一個有理有據的答案。
為什麼只舉例到3分的答案呢,因為作為一個數據分析的小學生,我給自己的邏輯也就打3分。
相信大家一定有更好的答案,歡迎留言指教~
那我現在該做些什麼?
如前面所說的,邏輯思維是做數據分析師最重要的先決條件。
如果你還停留在0分或者1分的水平,那麼我建議你可以先看《金字塔原理》這本書,正如這本書的副標題所說,它能夠教你的是——思考、表達和解決問題的邏輯。讀書的同時按照書中所講的方法對每一章節內容做金字塔形的總結筆記。
讀完這本書後,你可以再問自己一次,我為什麼要做數據分析師,我要成為什麼樣的數據分析師?然後用金字塔原理的方法去給自己一個確切的答案。
如果對自己的邏輯思維已經足夠有信心,那麼我建議你可以:
1、先去了解你的目標領域的行業知識,充分了解行業背景、原理、發展歷史和現狀;
2、想方設法去了解該行業內常用的數據工具、數據生產流程、數據應用;
3、針對性地對數據工具進行一段時間的系統性學習;
4、如果能找一些真實或者模擬的數據集進行一些實戰演練就更好了。
如同我在前面說的一樣——「世界上並非只有一種數據分析師」,成為數據分析師的路徑也不是只有一種,相信你會找到最適合自己的那一條。
如果你覺得我給的建議是在胡扯,那麼恭喜你,你已經具備了成為數據分析師的一條極為重要的特質——具有自己的觀點。
http://weixin.qq.com/r/czng_KfE8-qMreOb92xh (二維碼自動識別)
推薦閱讀:
※No4:我為什麼爬取各種數據?
※用簡單線性回歸分析學習時間與考試分數間的相關性
※一個不尷尬的茶會?或許可以用數據開啟
※開啟數據分析學習之路
※第三講簡單的數據處理和分析實踐筆記及課後實踐