轉行數據分析,你準備好了嗎?
前言
筆者從去年5月份下定決心離開汽車製造行業,6月份開始學習Udacity的DAND(Data Analysis Nano Degree, 數據分析納米學位)課程至今。歷經10個月挑燈苦讀和1個月四處碰壁,終於在近期收貨兩個offer,正式開始自己數據分析師的生涯。回望這段時間,一把心酸、兩處失落、幾多彷徨、些許苦悶,凡此種種不足與外人道。不過終究實現了職業生涯上一次重要的轉變。我把這個過程中所思、所想、經驗和教訓,做一個簡單的梳理,希望能夠給同樣正在準備轉行數據分析的小夥伴,提供一些微不足道的幫助。
不要等到一切就緒再找工作
雖然這篇文章的核心是講準備,但這裡要給大家的第一個建議是,不要試圖等到一切準備就緒再找工作。相信一定有小夥伴跟筆者曾經一樣,希望能夠完成數據分析課程的學習,對數據分析的知識掌握的比較熟練之後再開始找工作。但是,這個想法是不對的。
首先,數據分析是一個涉及知識面很廣的職業方向,數學基礎、分析思維、python、R、資料庫、大數據處理框架、數據可視化等等,這每一個方面展開來說都是一個非常龐大的課程體系,沒有人敢斷言自己能在所有這些方面有「充分」的了解,事實上這也是不必要的。即使對於工作經驗非常豐富的數據分析師來說,依然會有許多知識和技能是欠缺的,是需要持續充電的,但是這並不妨礙他們可以成為一名合格的甚至是優秀的數據分析師。
其次,每年的3、4月份正是各大企業招聘的黃金時期,在這個時候會湧現出大量的崗位需求,包括數據分析師。並且,由於需求的突然湧現,一般都會帶來一定程度的供不應求的狀態,企業也會根據需求的緊急程度來適當調整入職門檻。這對於準備轉行的小夥伴們來說,是個非常好的切入時機。 所以,當下,立刻,開始嘗試去找一份數據分析的工作!
什麼條件下比較有把握找到工作?
雖然說不要等到一切就緒再找工作,但如果能提前做好一些準備必然能大大提高job hunting的命中率。畢竟,機會是給有準備的人。我主要從知識積累和求職準備兩個方面來說。
知識積累
相信大多數準備轉行的小夥伴都已經通過各種途徑、方法開始自己的學習,也一定會發現,數據分析這個職業方向根本是個「巨坑」,需要掌握的知識技能簡直數不勝數。對於新手來說,面對諸多需要學習的內容很容易出現遙遙無期的無力感,或者迷失在知識的海洋中,漸漸偏離了自己的初衷。
筆者結合自身的學習、面試經驗做了一個整理,對於新手來說,掌握以下知識/技能,就足以找到一份初階的數據分析師(注意,不是數據專員,這兩者是有區別的,找工作的小夥伴切記仔細分辨)的工作:
- 統計基礎;
- 分析理論
- Excel
- SQL
- R
- Python
僅僅知道要學什麼是不夠的,還需要知道學到什麼程度才是合適的,這其實才是廣大新手村小夥伴最大的困惑!按照筆者的看法,以上每項技能/知識應當掌握的程度如下:
我把每個技能的熟練程度劃分為5個等級,依次分別是:1、了解基本概念;2、知道基本理論/會簡單操作;3、熟知原理/熟練操作;4、數學、邏輯論證/靈活應用;5、精通、專家/能改進、優化。對於入門者來說,上面這幾個知識領域大多只需要掌握2-3的熟練程度即可。
統計基礎是每個人都必須掌握的,自然是學的越深入越好,不過對於基礎比較差的夥伴來說,也不必太過苛求,大約掌握信息圖形化、條件概率、貝葉斯公式、相關與獨立、幾何分布、二項分布、泊松分布、正態分布、統計抽樣、估計、置信區間、假設檢驗這些,就差不多了。《深入淺出統計學》是一本不錯的入門書,但是僅有這一本是不夠的,請務必找一本更具嚴謹性和系統性的教材結合使用。
分析理論也是個繞不開的問題,尤其對於很多自學的夥伴來說,這一塊可能比較容易疏忽。筆者作為新手,對這部分內容其實也不熟悉,能給出的建議不多。這裡只推薦一篇文章,總結的比較精鍊:數據分析中有哪些常見的數據模型? - 知乎 (李啟方的回答)
大多數企業的內部數據存儲在傳統的關係型資料庫中,作為分析師不可避免的要和資料庫打交道,那麼SQL是數據分析必備的技能了。好在SQL語言本身非常的簡單易學。筆者認為只要會寫簡單的查詢、存儲過程就可以了,推薦大家買一本《SQL必知必會》放在手邊,隨時翻看。
R語言和Python語言應該是當前數據分析領域的雙雄了,R語言支持者眾多,相關庫包極為豐富;Python則勝在靈活易用,通用性更加廣泛。在網上,關於這兩種語言的爭論也從未止息。筆者建議初學者要對這兩種語言都有所了解,但選擇其中一項作為自己的主力語言。對於R語言來說,學會其命令行用法、掌握基本的數據分析庫包(tidyr,dplyr,ggplot2)即可;對於Python語言,需要掌握其基本語法、函數和相關庫包(numpy, pandas, matplotlib, sklearn)。
可能很多夥伴(包括筆者在內)經過一段時間學習以後,會對Excel這樣一個工具不屑一顧,認為這是個非常低端的工具,完全不如R或者Python一般酷炫。但其實完全不該有此想法。筆者曾爬取拉鉤網上數據分析這個崗位的信息並做過統計分析,在整個就業市場上,數據分析崗位對Excel技能的需求量非常之大,見下圖:
可以看到,除了SQL之外,Excel是數據分析崗位要求頻率最高的技能。好在,這個神器其實是非常簡單易學的,並且網路上存在海量的各種教程和教材,隨處可得。筆者認為只要學會常見函數的使用、各類基礎圖表的製作以及數據透視就能滿足大部分需求。推薦大家買一本《誰說菜鳥不懂數據分析》放在手邊,學習疲憊之餘拿出來當故事書看看。
機器學習這一塊其實應該算是數據分析崗位的加分項,不一定是必須的,看具體崗位。但是現在越來越多公司的數據分析崗要求對機器學習有一定的認知,筆者認為,關於機器學習演算法,能夠熟悉常見演算法的基本原理、了解其用途和優缺點即可。比如:分類演算法里的貝葉斯、決策樹、隨機森林;回歸演算法里的線性回歸、Adaboost回歸;聚類演算法里的K-means演算法等。另外了解一下用於降維的PCA等。
以上就是筆者認為做為初階的數據分析師大概需要的知識儲備,這些僅是個人經驗,不是普適的標準。每個人的情況不同,每個崗位的情況需求也不同,大家還是需要根據自己的實際情況來認真思考,安排好自己的學習方向和計劃。
求職準備
除了知識積累之外,求職前的準備也非常重要,可以說是最關鍵的部分。主要包括:項目經歷,簡歷準備,心態準備。
先說說項目經歷吧。當前幾乎所有企業招聘時都要求有相關工作經驗,而這個是轉行的小夥伴們的死穴,簡直無解。為了讓HR相信我們能夠勝任這份工作,我們必須拿出充分的證據來,在沒有相關工作經驗的前提下,找一些可以個人完成的項目來做就是唯一的選擇了。
準備兩到三個實際項目,能夠極大的提高HR對你的興趣,從而提高面試頻率和通過概率。拿筆主自己來說,在找工作之前完成了兩個實際的項目並形成了報告,其中一個項目被Udacity的知乎賬號付費轉載(可見:數據分析師掙多少錢?「黑」了招聘網站告訴你!)。正是在這個項目中很好的體現了數據分析的基本技能、方法和思路,所以吸引了HR的注意,並且最終打動了面試官。所以,在找工作之前準備幾個實際的項目經驗,對提高成功率幫助很大。
項目的來源很多,可以是工作中遇到的實際問題,也可以是學習過程中的練習作品,還可以是從類似於Kaggle這樣的競賽網站上找來的課題。當然,項目本身越靠近實際工作越好,這樣會比較接地氣。筆主當時工作方向和數據分析幾乎沒有關係,所以找了些自己感興趣的問題和學習中的練習作品寫入簡歷,當時打動面試官的項目是:拉勾網數據分析崗位分析。面試官坦言這個項目做的很接地氣,而且雖然沒有相關分析經驗,但是從項目中能看出分析思路是非常成熟清晰的,很不錯。
簡歷準備
寫簡歷的重要性就不言而喻了。一直以來,怎樣算是一份好簡歷,如何寫好一份好簡歷,都是HR和所有求職者津津樂道的話題。筆者這一塊其實並沒太多經驗,也曾因為醜陋的簡歷而屢屢碰壁。幸而偶然中認識同樣轉行的小夥伴@凌岸 ,他介紹我去看陳文老師的求職攻略課程,並且非常耐心的指導我該如何改簡歷。當晚我就對簡歷進行了一次大改。從自己實際的體驗來看,簡歷修改之前,投了數百份簡歷,可是面試邀請寥寥無幾。簡歷修改之後的第二天,投了16份簡歷,就收到了3個面試邀約,前後的差異之大簡直震撼。所以,簡歷準備這塊不展開講了,建議大家去聽聽看陳文老師的課程:求職必勝,提升面試成功率靠譜攻略 - 天善智能-商業智能和大數據在線社區,用心創造價值
心態準備
其實,心態的準備並不僅僅是求職前的工作,對於要轉行的小夥伴來說,這其實從下定決心的那一刻就已經開始了。
對於很多小夥伴來說,心態上最大的障礙可能是懷疑。放棄原行業數年的工作經驗是否值得?數據分析的職業前景到底如何?面對數據分析龐大的知識系統,自己是否真的可以掌握並找到工作?凡此種種。這些想法如同心魔一般時涌時現,揮之不去抹之不平,不斷的在動搖我們轉行的決心和學習的信念。
筆者也曾無數次的搖擺不定,也曾一遍遍的質疑自己轉行的決定,也曾懷疑自己對未來的判斷。直到最終找到了工作,方才鬆了一口氣,諸般心魔漸漸散去。其實秘訣只有一條:堅持。行動上堅持,心態上接納。沒有人能夠對未來有明確的判斷,人每一次的選擇都不可能保證是對的,所以產生疑慮是非常正常的。要學會和疑慮共處,在雜念叢生的同時,持續學習和改變。有一個理念非常關鍵,那就是要堅信:主動擁抱變化,永遠比被動接受變化更有意義。不管是因為什麼決定轉行,都一定是對原先的工作不滿,帶著不滿的工作勢必無法長久也很難提高。與其在不滿的崗位上空耗下去,白白蹉跎了時光,不如果斷轉身給自己一個新的開始。
心態上的第二個障礙,可能是氣餒。當學習進入瓶頸、當項目毫無頭緒、當找工作處處碰壁的時候,挫敗和氣餒的情緒便會油然而現,慢慢的打磨我們的鬥志,消磨信心。這個時候,學會對自己寬容是非常重要的。要明白,自己不是天才,在學習中遇到困難、找工作時被拒絕、甚至被HR輕視和刁難都是非常正常的。這是我們選擇改變所必然要面對的情景。這並不意味著自己不行,不代表自己不合適,相反,這些都是提高和改進的機會。另外可以想一想,很多統計學、數學、計算機科學專業的學生,大學經過4年的學習之後還要經過殘酷的競爭才能找到一份數據分析師的工作。而對於轉行的同學來說,大多數人可能計劃在1年之內完成知識的積累並找到工作。我們期望用更短的時間實現相同的工作目標,自然會遇到更多的困難和更大的挫折。而如果能夠克服困難挺過去,不是說明我們可能比職業選手更厲害嗎?不是嗎?
最後要說說耐心。有句老話叫:盡人事,聽天命。運氣這種東西確實時常捉弄人,飄搖不定無法把握。所以可能即便準備的非常充分,還是找不到工作。這時候未必是自己出了問題,可能僅僅是命運女神還沒有眷顧。對自己多點耐心,保持樂觀、保持信心,隨時準備好應對面試、應對HR的挑戰。即便單從概率來算,好運氣也遲早會光顧的。這裡改一句話:機會是給所有人的,提前做好準備,你就比別人更容易抓到它。
結語
人生就是一連串的選擇,年紀越大,每一步的選擇就越困難。但是不管在任何階段,敢於改變、敢於突破自己的人都是值得敬佩的。我相信所有有勇氣、有毅力做出改變的人,都比別人有更多成功的可能。祝願所有準備轉行的夥伴都有好運氣,也祝願所有已經轉行成功的夥伴迅速成長。
書單
評論區有的夥伴想要完整的書單,我簡單列一下我自己使用的感覺比較好的書:
- 統計基礎:《深入淺出統計學》、《商務與經濟統計(第12版)》
- 分析理論和Excel:《誰說菜鳥不會數據分析》
- SQL:《SQL必知必會》還有MySQL的官方教程
- R語言:《Learning R》、《R語言實戰》
- Python語言:隨便一本入門教材 + 《利用Python進行數據分析》、《Python科學計算》。Python除了最基本的語法和數據結構之外,最重要的是Numpy, Pandas, matplotlib, Seaborn, scikit-learn這幾個庫包。看書只能了解一小部分,更多的是要讀官方文檔。
除此以外,強烈推薦Udacity的數據分析師納米學位課程。以跟隨教程學習為主,看書補充為輔,這樣的話不用把每本書從頭到尾全部看完,對於新手來說可以節約大量時間。另外,課程中本身帶有7個項目,可以用來練習,也可以作為項目經驗寫進簡歷。尤其是P5的項目,本身就來源於實際項目,非常好。
PS:今天一覺醒來,發現點贊數居然過百了!作為一個知乎小透明,第一篇文章能收穫如此多的贊同,筆者感到萬分驚喜呀!謝謝各位小夥伴對我的認可!希望我的文章能給大家一點點微不足道的幫助!從大家點贊的熱情來看,想要轉行數據分析的小夥伴群體確實很龐大呀!筆者打算開闢一個專欄,陸續分享自己的學習和成長經驗。筆者不是大牛,給不出高屋建瓴的指導性意見,但是作為一個半隻腳踏進門檻的菜鳥新人,還是可以跟大家分享一下學習中的經驗、教訓,還有一些筆者自己跳過的坑。希望能幫助大家繞過一些坑,分享一些小的技巧,給大家的學習帶來一點點小小的幫助。有興趣的夥伴可以持續關注~
再次祝大家學習順利、轉行順利~
PPS:都看到這兒了,順手點個讚唄?
推薦閱讀: