標籤:

而立之人的數據分析學習之路

前言:看了猴子關於在知乎上寫文章的建議,想想也對,畢業10多年了,過了而立之年的我還沒怎麼回頭總結一下畢業以後在前進道路上的方方面面,既然猴子定下了這個規矩,那麼就借這個機會總結一下。文筆不好,讓各位見笑了。

我,211大學本科畢業,計算機專業,入學後各種完全無視老師的教誨,渾渾噩噩的畢業,又渾渾噩噩的玩了大半年。本想用考研來逃避工作,但是大學成績糟糕的我,不出意外的名落孫山。這下子只有出去工作了。

關於工作嘛,我當時想既然要工作,還是找個計算機專業對口的吧,找來找去,依仗著我的211畢業證,蒙進了一家台資企業做軟體開發,我記得當時是做語音電路板的和做CTMS(好像是叫這個名字,就是三網合一的頭端設備),工作中,我基礎實在太差,只有邊看書邊工作,最簡單的演算法都搞了半天,還漏洞百出,就這樣,這個工作堅持了約1年多,就不行了,寫代碼的任務本就重,周末和晚上長期加班,而且我的代碼問題多多,算了,不幹了。就這樣第一份工作就被我廢了。

怎麼辦呢?我迷茫了,前路茫茫,算了,我反正是堅決不當碼農了。後來我媽建議去考公務員吧,去做管理類工作,也穩定點。好吧,反正閑著也是閑著,於是就考上了我們本地的市級公務員(我是在直轄市),我當時想著以後可以泡茶看報,順便收收小錢的日子,就暗自竊喜。但是,正如歌里唱的那樣,不經歷彩虹怎能見風雨,我入職半年後,風雲突變,領導下課了,新來的領導一上來就瞎折騰,要到下面各區縣的下屬機構去巡視考察,除了相關人員陪同之外,莫名奇妙的把我帶上,我擦,一個月跑了近2000公里,上山下鄉深入基層,每次考察的文字材料必然是我的(誰叫我背個211大學生的名,TMD),沒辦法,我只有盡心儘力的討好領導,每次考察回來後,不管多晚,必定第二天就把考察報告交給領導,漸漸的除了重要的稿子是專人擬稿外,一般的考察報告,調研報告,都是我起草,各種調研報告寫多了,腦袋裡面自然而然就形成了一種想分析各種統計數據的思維,也或許就是我數據分析的萌芽吧。在隨後的幾年,我逐漸對數據分析產生興趣,嘗試著用最原始的方式製作各種分類統計報表和PPT,說來好笑,這種在現在看來,十分低級粗糙的分析方法,在當時居然深得領導喜歡(沒辦法,這裡50、60後的老機關太多,有的連打字都不會)。後來我又待了幾年,因為種種原因,我離開了機關,進了我現在供職的一家國有企業。

我現在的單位是一家從事專業市場建設和開發的國有企業,這是一個完全市場化的行業,我所在的部門就是整個項目的論證部門,負責形成分析材料供領導決策,但是因為單位是國有企業,在項目運作上有著自身的「獨特優勢」,對於項目的決策完全基本上不會參考我們的意見,而是典型的拍腦袋加靠私人關係決策。舉個幾個典型例子,單位董事長與某區委書記關係比較鐵,幾次會談後,不顧農業專家的反對,硬是把一個與台灣合作的農業項目落戶到該地區,佔地500畝,後來項目失敗了,3個億的投資打水漂。還有一個,單位與天津的一家企業合作開展進出口業務,因為沒有對對方公司和從事行業進行詳細的調查和分析,輕易的涉足形式複雜國際貿易行業(非我司主業),結果出現7億的的重大投資失誤。還有,由於輕易涉足社區連鎖超市業務,對這個行業缺乏分析和判斷,盲目擴大生產,3年間在全市開了300多家連鎖超市,後來在激烈的競爭下,倒閉90%虧損近3億元,其中還有1個億的國家產業扶持資金。這樣的例子還有好多,後來董事長和上級分管領導分別下課,接受審查,到現在審查還沒有結果(因為涉及到副-B級和正-T級領導)。

後來新任領導來了,強調要完善科學決策機制,做到決策有依據,不搞一言堂,經過這一年的發展,我這才覺得我現有的分析知識完全是不夠用了,我也失去了很多在領導面前展示自己的機會,單位目前的論證分析主要還是以第三方諮詢機構為主,每年論證費用在三百萬到五百萬之間,這些諮詢機構的分析報告我看過,通過與知乎上這些大神的文章一對比,感覺他們就是用了最基本的幾種統計方法,通過建立簡單的分析模型得出結論,就這樣幾百萬就到手,這也錢也太好賺了。再往後面想,要是我會的話,每年為單位節約大筆諮詢費,那我又該是什麼地位呢?於是這就是我的學習動力了,所以數據分析我是一定要學會的。

好吧,洋洋洒洒說了這麼多,按照猴子的要求,計劃是必須做的,雖然後面會做調整,但是大的時間節點應該是不會變的:

現在至2018年3月,學完《深入淺出統計學》,同時學習python基礎知識。目標:能夠完成中級水平的網路爬蟲的編寫,具備基本的數據收集能力。

2018年3月至7月,結合《利用python進行數據分析》或其他類似書籍,學習數據分析實踐基礎。目標:能夠利用統計學結合python,實踐各類常見的數據分析方法,具備基本的數據分析能力。能夠利用

2018年7月至2018年12月開始學習數據挖掘和高級的統計分析方法,並進行項目實踐。

上述計劃其中有穿插EXCEL,SQL、PPT等數據分析工具的中高級用法(PPT用於製作領導喜聞樂見的幻燈片,我也歸為相關工具類),時間保證每天至少1小時。

推薦閱讀:

「一起學」Udaicty 數據分析(入門)P4 項目總結
華為P10與小米6誰更受用戶青睞
有沒有一些入門級的機器學習或數據挖掘的書推薦呢?演算法理論實戰都行的。

TAG:数据分析 |