為什麼要大數據分析?怎麼學?

大數據分析一詞這這裡的使用已經過於寬泛了。寫這篇文章主要目的還是給自己學習使用R語言做大數據分析做下計劃安排。一樣在學習大數據分析路上的道友共勉。

先回答幾個問題:

  • 什麼是大數據分析?為什麼要學習數據分析?
  • 如何開始?
  • 怎麼堅持?
  • 如何運用到工作中?

什麼是大數據分析,為什麼學

在加入猴哥的大數據分析社群後,分享給我了東吳相對論里對於大數據分析的解讀。聽完也確實頗受啟發。以下是這次訪談的思維導圖。

在冬吳相對論中對於大數據有一個比方「大數據就像是石油和煤一樣的資源,從我們文明還未開始就已經存在,只是現在社會我們知道了如何去開採,而下一步就是如何去使用他。」 面對如此巨大數據資源,隨之而來的便是一個非常現實的問題如何分析運用這些數據使其成為有用的信息。

大數據的核心是從重因果到重相關性分析的轉變。

我的理解是現在快節奏的生產生活下,人們追求的是事物的結果和辦事的效率。而現在獲取各種海量信息已經成為特別輕鬆的事。用戶的各種購買消費信息,行為習慣信息,就診信息以及個性需求信息都隨著大數據技術的開發可以輕鬆獲取。裡面第一個例子講到是通過美國醫院,藥店和保險的大數據信息共享,通過患者在醫院的就醫記錄,藥店的消費記錄和保險的索賠信息的分析,就可以對任何數據異常以及疾病的流行做到趨勢預測和快速反應。通過對大數據的分析可以迅速高效地了解相關事物的趨勢和結果的預測。

需求決定市場

既然存在如此大的數據資源,如何高效正確地使用就成為了現在大家都在研究的問題。由此便衍生了各種大數據分析的職位。對於像我不是技術出身的人來說,我需要深入學習的不是如何獲取數據或者是如何進行構架,而注重的是讓數據服務於我,提高商業競爭力,掌握業務動向。所以掌握一款數據分析的語言,增強數據分析知識結構可以讓我高效地提高業務水平。當然,這也符合我個人興趣。想要了解隱藏在數據背後的故事。

如何開始,又如何堅持

我現在的工作是全職項目管理,對於如何做項目計劃已經熟門熟路。對於我如何學習大數據分析我做了以下準備。

  • 制定階段性學習目標,以及最終目標。
  • 詳細的學習計劃。
  • 學習資源。

學習目標

  1. 獨立完成Kaggle上 Titanic: Machine Learning from Disaster,House Prices: Advanced Regression Techniques。
  2. 有用學到的知識為我們公司建立數據分析的體系,KPI和優化商業流程。

學習計劃

這裡附上我用excel project template 做的一個計劃。在ACTUAL START 和 ACTUAL END 兩欄中填入實際開始時間和實際結束之間,通過左邊的甘特圖可以追蹤學習進度。對於本次學習我一共安排了45周。

這裡截取了我項目計劃的一部分。需要用我模板做計劃的同學可以在下面學習資料中下載(只要改變階段性任務的名稱,PLAN START 和PLAN DURATION就可以製作你自己的計劃)。

學習資源

由於未來工作需要,選取的學習內容都為英文版本。如需要中文版請大家尋找其他同名中文資源。

  1. 項目計劃 excel
  2. R in Action
  3. Introduction to Data Mining
  4. Statistics for Business and Economics

  5. SQL-w3schools.com/sql/defau
  6. Kaggle-Your Home for Data Science

計劃書和學習書本網盤地址。

最後祝大家都可以圓滿完成自己的學習任務。對於以上資源有疑問的朋友可以給我留言。或者你也想加入我們大數據分析社群的朋友請看傳送門


推薦閱讀:

數據分析第一關:初入數據之門

TAG:數據分析 | R | 數據挖掘入門 |