從零開始學數據分析,什麼程度可以找工作?

我現在在coursera 上面學data science 中的R programming,本碩均為化學工程,過去很少接觸過 統計、計算機 這兩個學科,現在很想轉行做數據。問題如下:
1. data需要學到什麼程度可以找工作?
2.初級的數據分析會做哪些工作?
3.數據分析有什麼小方向嗎?
4.想要深度做數據分析有怎樣的建議
5.統計的學習應該從哪裡下手
希望得到大家的指導,現在對這個行業的了解處於很模糊的狀態,想儘快步入正軌。


基本答一下吧,但是不是很準確,只了解大致情況(杭州),帶有某種行業自黑。

1. 第一階段(一般崗位叫數據專員)

基本學會excel(VBA最好學會;會做透視表;熟練用篩選、排序、公式),做好PPT。這樣很多傳統公司的數據專員已經可以做了

2. 第二階段(數據專員~數據分析師)

這一階段要會SQL,懂業務,加上第一階段的那些東西。大多數傳統公司和互聯網小運營、產品團隊夠用了。

3. 第三階段(數據分析師)

統計學熟練(回歸、假設檢驗、時間序列、簡單蒙特卡羅),可視化,PPT和excel一定要溜。這些技術就夠了,能應付大多數傳統公司業務和互聯網業務。

4. 第四階段(分裂)

    • 數據分析師(數據科學家)、BI等:這部分一般是精進統計學,熟悉業務,機器學習會使用(調參+選模型+優化),取數、ETL、可視化啥的都是基本姿態。
    • 可視化工程師:這部分國內比較少,其實偏重前端,會high charts,d3.js, echarts.js。技術發展路線可以獨立,不在這四階段,可能前端轉行更好。
    • ETL工程師:顧名思義,做ETL的。
    • 大數據工程師:熟悉大數據技術,hadoop系二代。
    • 數據工程師(一部分和數據挖掘工程師重合):機器學習精通級別(往往是幾種,不用擔心不是全部,和數據分析師側重點不同,更需要了解組合模型,理論基礎),會組合模型形成數據產品;計算機基本知識(包括linux知識、軟體工程等);各類資料庫(RDBMS、NoSQL(4大類))
    • 數據挖掘:和上基本相同。
    • 爬蟲工程師:顧名思義,最好http協議、tcp/ip協議熟悉。技術發展路線可以獨立,不在這四階段

發現回答的有點文不對題額,不過大致是所有從底層數據工作者往上發展的基本路徑。往數據發展的基本學習路徑可以概括為以下內容:

1. EXCEL、PPT(必須精通)

數據工作者的基本姿態,話說本人技術並不是很好,但是起碼會操作;要會大膽秀自己,和業務部門交流需求,展示分析結果。技術上回VBA和數據透視就到頂了。

2. 資料庫類(必須學)

初級只要會RDBMS就行了,看公司用哪個,用哪個學哪個。沒進公司就學MySQL吧。

NoSQL可以在之後和統計學啥的一起學。基本的NoSQL血MongoDB和Redis(緩存,嚴格意義上不算資料庫),然後(選學)可以了解各類NoSQL,基於圖的資料庫Neo4j,基於Column的資料庫BigTable,基於key-value的資料庫redis/cassendra,基於collection的資料庫MongoDB。

3. 統計學(必須學)

如果要學統計學,重要概念是會描述性統計、假設檢驗、貝葉斯、極大似然法、回歸(特別是廣義線性回歸)、主成分分析。這些個用的比較多。也有學時間序列、bootstrap、非參之類的,這個看自己的意願。

其他數學知識:線性代數常用(是很多後面的基礎),微積分不常用,動力系統、傅里葉分析看自己想進的行業了。

4. 機器學習(數據分析師要求會選、用、調)

常用的是幾個線性分類器、聚類、回歸、隨機森林、貝葉斯;不常用的也稍微了解一下;深度學習視情況學習。

5. 大數據(選學,有公司要求的話會用即可,不要求會搭環境)

hadoop基礎,包括hdfs、map-reduce、hive之類;後面接觸spark和storm再說了。

6. 文本類(選學,有公司要求的話會用即可)

這部分不熟,基本要知道次感化、分詞、情感分析啥的。

7. 工具類

語言:非大數據類R、Python最多(比較geek的也有用julia的,不差錢和某些公司要求的用SAS、Matlab);大數據可能還會用到scala和java。
可視化(選學):tableau、http://plot.ly、d3.js、echarts.js,R裡面的ggplot、ggvis,Python里的bokeh、matplotlib、seaborn都不錯
資料庫語言:看你自己用啥學啥
其他框架、類庫(選學):爬蟲(requests、beautifulsoup、scrapy),日誌分析(常見elk)


更新:
今年初由於換工作的原因,意外的和曾經的一些同事有了聯繫,其中3個數據分析師都轉成了數據產品經理,幾乎沒有純粹做數據分析的同事了。數據分析師入門容易,但越到職業發展後期,對技能要求越高,學習成本陡增,身邊一些數據分析師都在學習python,但真的能在實際工作中運用的機會很少,所以轉向數據挖掘方向的難度很大。也許數據產品經理是很多數據分析師在工作幾年後一個不錯的選擇。

以下是原答案:我工作5年,一直在互聯網公司做和數據相關的工作,
接觸過各種數據分析師,數據專員,etl工程師,數據挖掘,數據科學家,數據運營,數據產品。看了其他人的答案,我覺得更偏向數據開發,或者數據挖掘,我來說下一般招聘網站里要求的數據分析師的情況吧。
對數據分析師的要求和數據分析師所隸屬的部門相關,數據分析師一般存在於三類部門:
一是隸屬於負責某一條產品線的業務部門,部門只有一個數據分析師,也可能叫數據專員,部門內的其他人是運營、產品,數據分析師的日常工作就是給領導或同事出各種數據報表,偶爾出個報告,只要熟練掌握excel和ppt即可,數據來自bi系統,或者提需求給技術部或數據部提取數據。統計學的知識用不上,因為你的領導和同事完全不懂,他們就是想看某個數據,需要你給出數據來證明他們產品改進或運營的效果,他們會根據經驗來理解這些數據。這類數據分析師的工作比較機械重複,但對自己所屬的產品線非常熟悉,適合剛畢業的。
二是隸屬於數據部門,有的也叫數據中心(或者裝B的大數據中心),數據分析師也可能叫數據運營,需要熟練掌握sql,了解資料庫的知識,有的也需要會python,每天大部分工作是寫sql幫業務提數,還有就是幫業務梳理邏輯,把數據需求落實進bi系統或寬表裡。
三是隸屬於業務部門裡獨立的數據組,整個組由多個數據分析師組成,所需的技能和行業相關,一般電商之類的熟練掌握excel、sql、spss就夠了,如果是金融行業,那就得會sass。工作是製作各種報表,監控業務情況,也會有專項分析報告,主要是向大領導彙報。
其實現在大部分互聯網公司的數據建設都不健全,尤其是流量數據,但出於安全性的考慮又不用第三方數據分析系統,所以無論你是哪個部門的數據分析師,大部分的工作都是在獲取和加工數據,做數據報表。對工具的掌握決定了你獲取和加工數據的效率和層次,比如你只會用bi導數,用excel處理數據,在遇到bi沒有的數據,或者涉及幾十萬數據量的時候,你就只能寫郵件提需求了。
但也不是說掌握了各種技術和工具就能當個好的數據分析師,好的數據分析師必須是要非常熟悉並理解業務的,因為你要是不懂業務,你連需要取什麼數都不知道!
現在還有一個崗位和數據相關,叫數據科學家,很像其他回答里說的那種懂各種演算法,或者高階的數據分析師,但這類數據人員基本不是從低階數據分析師進化來的,而是本來就是計算機相關專業的碩士或博士。同樣的還有數據挖掘工程師。
如果想走技術路線,或者所謂大數據方向,最好去公司專門的數據部,起碼可以接觸到更多的數據和技術。如果在業務部門做數據分析師,雖然門檻低好入行,但沒有機會和空間,做的時間再久也是導數做報表,發展不大。


我是本科畢業工作兩年轉行數據分析。
我的答案是——取決於你想找哪個程度的數據分析師崗位。
我的經歷供你們參考:當初為了轉行,辭職半年。這半年各種學python,SPSS,SQL,數據分析理論,結果呢,你會發現怎麼學得完?而且你根本不知道你將來的崗位需求是什麼,你原來沒做過數據分析的話你也不會明確知道自己該加強哪一塊。後來找工作,別人不要沒經驗的數據分析師(口徑一致地說我們沒空慢慢培養你),要的呢,你只需要會excel。建議現在就開始投簡歷,跟人家聊,人家需要什麼你就學什麼。然後你需要證明你會數據分析,能自己做分析,出報告。到這個程度,人家就會看上你。我就是這樣找到我的第一份數據分析工作的。我現在的工作內容只用到EXCEL,是的,本科生剛畢業都會做了,但這是跳板。人家看上我不僅是因為我會EXCEL,還因為我有他們行業的經驗(區別於數據分析的行業經驗,數據分析只是通用技能),所以我目前的階段,想過度到專門做數據分析,初級崗位我能夠得著,也就剛好用Excel就夠了。我想你這種情況,應該有適合你的起點——化學工程沒有相關的統計項目嗎?


我來提供個最快捷的路子吧,不為別的,請那些簡歷上寫了「數據分析」方向的筒子們先看一下,會了再投,不會不要去面,希望不大,浪費時間。

1. 數據結構和演算法,這是是必須會的。跨專業的人往往忽略這一點,但這是跟實際工作相關的東西,cs其他的可以暫時不會,但這個一定要會。要手工刷代碼。

2. java,python, R, 精通其中一種,精通就是拿它做過一個完整的項目,從頭到尾,全須全尾,經得起問。如果都是淺淺的知道,那是沒用的。

3. 手工刷過data mining和prml上的三四種以上有工作量的演算法。kmeans和knn這種太簡單了不能算。

4. 概率線代高數統計,需要維持在本科考試60分水平。

5. 簡歷不要造假,簡歷上寫的你會的東西都要經得起問。不要偽造獲獎經歷,一分鐘問死你到現形。

這是基線,低於這個水平,像樣的公司不可能給offer。


很多數據分析方法的崗位,偏業務理解、分析思路、基本操作比較多。動輒就是hadoop、python、r的,對想入行的同學來說真的鴨梨山大的。

一、首先定義我們的目標,「什麼是從0開始到能夠找工作」
那麼我的理解是,懂得常規知識並能找到基礎的工作是我們的目標。

二、再來看看,積累哪些技能才能夠找到基礎的工作
想要做好數據分析真的需要掌握多方面的知識和技能,主要分軟+硬兩大實力,軟實力還包括溝通能力、表達能力、設計能力等;另外業務理解能力需要逐步積累。那麼,對於入行來說,可從思維、心術、理論、工具四方面進行訓練和事先判斷。思維和心術主要靠性格和長期訓練積累,下理論和工具是可以學習和訓練的。
下圖主要適用於入門的學習,雖非高階,但確常用而必備

三、如何積累基礎的技能
理論:
1、統計學是必須要了解的,知其然知其所以然,對分析結果的判斷也是有幫助的;
2、基本的分析方法論也要了解,常用的有對比、趨勢、細分等;
3、管理理論特別是麥肯錫的那一套對於分析思路的開闊也比較有幫助,數據分析始於商業分析/業務分析,那麼必備的方法論一定要瞭然於心。

工具:

為什麼很多人學了Python、Hadoop、R、Spss,依然做不好數據分析。

數據分析最關鍵的一定是理解業務的能力以及整理分析思路的能力,其次才是動手能力,也就是駕馭工具的能力。至於工具,不論黑貓白貓解決問題就是好貓,不是說Hadoop就比Oracle強,python就比spss厲害,不同的場景不同的背景對工具的使用也不同。


對於入門來說,掌握常規的即可:Excel+Sql+PPT,Excel的簡潔和強大無需多說了,小規模的數據處理、分析、展示都可以搞定,對於稍大點規模的公司而言,Sql是必備的取數技術,沒有數據源就等於是無源之水,所以數據查詢和處理能力一定要具備。那為什麼還要PPT?數據分析師很多時候的產出是分析報告,那麼PPT的展示能力就格外重要,如何將你的結論簡潔直觀的傳遞給你的受眾,是必備的能力。

簡單的回答一下,具體參見原文數據分析,你真的準備好了嗎? - tommy的文章 - 知乎專欄


學完123就可以了吧。

……

加兩張,來自網路。


數據分析,註定是「數據科學+行業經驗」的雙天賦技能樹成長模式。
也就是說,你必須在具備豐富的行業經驗的同時,還要開發自己的數據科學技能。
加倍的技能樹,加倍的努力!


擅長玩狼人遊戲,玩到首輪不是殺手必死的境界!

擅長玩三國殺,玩到把把內奸干翻全場的境界!

閑著無聊喜歡邏輯推理,比如轉角遇到個美女的概率是多大?

能在短時間內就能掌握新知識,比如從零開始學習個繪畫攝影什麼的!

最後,也是最重要的一條:遇到一個像我這樣的面試官!哈哈哈哈!

說實話自學的那些個編程語言算是能證明你的學習能力還不錯吧!工作需要的軟體和語言對於學習能力強的人來說還不是半天的事情!

以上!


羅賓同學寫的非常完整了,基本市面上做數據分析的就是這三大類以及一個終極目標:
1.數據開發類,本類要求最多,且基本走在時代前沿,軟體入門級別分別是Python&>Java&>Hadoop&>Spark等等,這個順序仁者見仁,意思就是說最起碼得會Python,網上Python較多,客觀來說此類崗位要求經驗較多,相對加班較多,工資也相對最多。
2.數據分析類(業務部門類),首先找工作的時候一定開清楚,它到底要你處理的是什麼方面的數據,如果動輒上千萬,Excel肯定是解決不了的,而且一般商業化的場景基本都是Sas,R,Python運用較多,這塊看個人造化吧,有很多人通過這個後來也成功轉崗,這裡的意思就是轉到業務上去,實際上隨著現在大數據的應用,很多重要的崗位除了經驗的積累也需要對數據方面的了解,所以說還是很有前景的,我也算這一類吧,大概從業也是4年左右,當然我是從第一類到第二類的,也是個人的選擇。
3.數據ETL架構師,這些崗位往往寫著數據分析師的牌子,做的其實系統做的事,提取,清洗等等,並不是說不重要,因為工作相對基礎,重複性比較多,完全可以當做這份數據分析工作的開始來做。軟體使用方面:Sas,R,Hadoop,Java。
4.最後就是數據科學家,本類崗位非10年+經驗無法駕馭,國內幾乎沒有,但也並不完全是做CS的轉過去的,很多都是在經過業務過程中自己摸索學習的,所以你可以簡單的把它定義為數據分析師的終極目標,至於具體做法就是學習,了解最前沿的技術,很多時候不是你的心沒到位,是你的努力不到位,是你周圍沒有那種環境(軟體,硬體皆是)。
最後說一點就是一般的發展路線就是數據分析師---數據主管----業務主管-----相關總監或者是數據分析師----項目經理-----高級經理-----XXXXX,每個人的路自己想清楚,都是需要不停學習的。祝你好運。


從零開始學數據分析,什麼程度可以找工作?
1. 掌握基礎的演算法和數據結構。面試的時候會考察這些基本功。建議去leetcode上刷題,或者拿個演算法導論翻一翻。適當的準備一下,面試的適合一般不會太難,常見的是字元串類、數組鏈表類和排序類題居多。
2. 會寫sql。這是分析數據的工具。熟悉sql基礎的函數,外連接等操作。
3.懂點統計學。這是分析數據的思路。
以上三點差不多可以讓你找到數據分析的工作。最重要的是進入工作崗位後要繼續成長。關於合格數據分析師,甚至數據科學家的描述,請參考排名前幾的答案。

最後打個廣告,美團現在正在熱招數據分析、數據倉庫ETL、數據挖掘等方向的工程師。要內推的請看我簡介。


數據分析的工作內容(熟悉任何一方面都可以開始找工作):

a.臨時取數分析,比如雙11大促活動;產品的流量轉化情況、產品流程優化分析,等等;
b.報表需求分析--日報、周報、月報、季報、年報、產品報表、流量轉化報表、經營分析報表、KPI報表等等;
c.業務專題分析:
精準營銷分析(用戶畫像分析、營銷對象分析、營銷策略分析、營銷效果分析);
風控分析(策略分析,反欺詐分析,信用狀況分析);
市場研究分析(行業分析、競品分析、市場分析、價格分析、渠道分析、決策分析等等);
工具和技能:
工具: R、Python、SAS、SPSS、X-Mind、Excel、PPT
技能:需掌握SQL資料庫、概率統計、常用的演算法模型、分析報告的撰寫等等;


會用R語言或python進行基本的數據處理,懂SQL語句,再有點統計知識和行業經驗,就可以開啟投簡歷找工作的模式了。根據投簡歷和面試獲取市場的真實反饋,進而有側重地填補自己缺少且必要的內容。以下是我跨行求職數據分析的過程,供你參考。

求職數據分析的面面觀


最近也在做


已刪除


數據的核心工作主要包括數據的採集、存儲、分析和可視化,每一塊內容都會涉及到相應的技術。參考我的另一個回答:如何快速成為數據分析師? - 張宏倫的回答 - 知乎

如果你已經能夠獨立地完成一些數據分析項目,積累了一定的項目經驗,並且有一些可供展示的demo,得到了一定的認可,差不多就可以去找心怡的工作啦~


專科生做數據分析有發展前途嗎?


我領導讓我負責本部門數據分析

先說吧,本人EXCEL和PPT水平還行,未到高手水平,處理一些日常工作還是得心應手

剛開始也是從零開始

其實工具什麼多,不是會得多就好,用得順手才是好

然後我領導經常教我們,數據分三步走,數據統計 到 數據分析 到 數據管理

數據統計就是把你要數據拿到手

數據分析就是找出數據裡面的問題點和重點

數據管理就是解決和運用你用數據分析出來的東西

最後,本人跟著我領導混了兩年,最大感受是:腦子好,邏輯強

像我領導那樣,EXCEL水平其實不高,PPT也不會做(都是我做的),但是我給他一份數據,他可以快速找出裡面的邏輯錯誤,以及一些問題點,這個是我的目標

扯那麼多,也沒涉及實際工具,啊,希望題主自行斟酌


樓主學完了么?我也在奮鬥這個部分,不過是想做基因統計學,基因解讀,我覺得數據處理要結合一個方向,數據分析必定只是一個工具。


數據分析,編程,英語,學會後。然後找相關數據工作,在工作中進行數據分析,慢慢培養數據敏感度。可以先從excel開始,從傳統行業開始,先工作,任何工作都會用到數據分析。


只要3天自學,即可考過Tableau Associate認證,之後就能找到起薪1萬的工作。So easy。


推薦閱讀:

面試官如何判斷面試者的機器學習水平?
貝葉斯學派與頻率學派有何不同?
強大數定律和弱大數定律的本質區別?
導演風格是什麼?一個導演的風格是如何形成的?
點估計、區間估計、中心極限定理之間的聯繫?

TAG:統計學 | 數據分析 | 職業規劃 | 大數據 | 數據科學 |