標籤:

2017上半年數據分析學習計劃

我是一名企業管理專業的研二學生,市場營銷方向。我先是關注了猴子老師的公眾號,然後知道數據分析這個live,當時老師以「共享經濟實驗」名義發起這個活動,因為我關注sharing economy比較多,並不認為這是共享經濟,所以心裡還略有的不爽(不爽是因為看了很多為了湊熱點而生搬硬套說自己做的是共享經濟事業的現象)。不過看到數據分析這個topic蠻吸引我的,就參與這個活動並且向同學推薦了live。

為什麼我認為數據分析有吸引力,之前看《增長黑客》黑客一書,增長黑客指以數據驅動營銷、以市場指導產品,通過技術化手段貫徹增長目標的人,我希望自己也能成為一名增長黑客,營銷理論學了一堆,也有相關的實踐,但是技術是我的短板,因此我希望學習數據分析技術彌補自己的不足,增強未來求職的競爭力。下面說說我和數據分析的小緣分——科研中遇到的數據分析工具(不是指SPSS、Excel、Matlab這些看起來就是處理數字的,雖然這些也經常使用,而是處理文字、音頻視頻圖片那些),還有學習計劃。

科研中的數據分析工具

研究生階段,導師為我們指定了「分享經濟」這一領域,圍繞這一點我們選擇自己喜歡的角度進行資料搜集,確定選題。聽了猴子老師第一期的live,我發現自己在資料搜尋的階段其實就已經藉助了一些數據分析工具了:

1、看到百度指數這個圖的時候,我想起我在知網做資料搜集時用的「指數」功能——快速地了解某一領域的研究情況(國內),還能檢索不同年限的文獻、經典文獻等。

2、後來我決定做質性研究——案例研究(研究方法簡單分為定量和定性,我選擇了定性研究,現在已經研二了,意味著我不大可能從零開始做一個定量研究,紮實學點數據分析方法可以彌補這方面的不足),在資料庫檢索了來源於SSCI質量較高、被引量較高的期刊之後,這些研究關注的是分享經濟的哪些方面?為了粗淺地有個了解,我把搜索到的文獻導進Nvivo軟體里做了一個詞頻分析。

圍繞著分享這個主題,很多學者認為這是新型(new)的消費(consumption)方式——基於使用權(access)而不是所有權(ownership);有人關注其商業模式(business model),有人關注在這個系統中的消費者行為(hebavior);在這個領域裡,研究得比較多的是汽車(car)行業……在沒有任何想法的時候,這樣的分析結果可以用來做頭腦風暴的依據,也可以知道研究熱點在哪。

這樣的分析結果是比較粗糙的,提煉不出邏輯性、針對性強的信息,我在一篇文獻里看到彌補這些缺陷的、非常酷的共引分析(工具:BibExcel program)與文本分析(工具:Leximancer),第一個圖的共引分析看出學者之間文獻的引用關係,強關係的共引有著共性的研究主題;第二個圖是文本分析結果,可以得出,總體而言,目前分享經濟的研究有三個突出的主題:分享經濟的商業模式及其影響;分享經濟本質;分享經濟的可持續發展,每個主題包含哪些內容均一目了然。

截圖來自paper:Sharing economy: A review and agenda for future research,Mingming Cheng

這些工具讓我體會到數據分析工具真的能為學術研究帶來高效率,在大數據時代,做研究的方法也要跟著進步。另外,對於顏控來說,數據視覺化真的太有魅力了。

學習計劃

基礎方面,我簡單學習過概率論與經管領域的統計學應用,三四年時間過去忘得差不多了,另外大一學過C語言與VB,感覺自己對編程還是有點興趣的,最近也啟動了python的學習。這樣看來,對於數據分析我基本算是零基礎的。

因為我想把知識吃得透一點,所以對於猴子老師羅列的書單,我作了這樣的安排:以R語言學習為主線,R語言學習過程中牽涉到其他幾本書的知識,再補充該部分知識。比如看了一下《R語言》目錄,有的明顯需要統計學知識的(思維導圖中建立link),學習這些章節的時候把《深入淺出統計學》作為參考資料去看。因為關於SQL、python、統計學這幾項,我只對統計學有認識,所以只能建立這個link,在往後的學習里,發現更多的知識link要逐步建立,形成自己的知識網路。

操作層面,知識總結就在這張思維導圖上做,聽完講座,筆記與收穫記錄在左側,書目的學習筆記與心得(篇幅長,以備註形式)記錄在右側,把這兩種學習結合起來。圖中黃色框代表月計劃,月計劃的下一級表示周計劃,基本是每周一章的學習進度,其實強度算是比較大的,到了真正行動的時候可能需要根據具體情況作出調整。最後形成的思維導圖,就是我在數據分析學習方面的收穫。另外,看了Udacity的商業數據分析納米課程,我對於那種解決實際問題的學習非常感興趣,然而學生黨買不起U的課,所以很希望在這裡學習也能得到實戰的機會,問題導向的學習會讓我更加有前進的動力!

推薦閱讀:

大數據之數據分析精進之路:起跑
用Python預測「周期性時間序列」的正確姿勢
一篇文章入門Python
選全明星哪家強,機器學習來幫忙
2018年一定要收藏的20款免費預測分析軟體!

TAG:數據分析 |