通過數據洞察世界

進入互聯網時代之後,獲取數據越來越便利,數據量越來豐富。特別是進入移動互聯網時代後,手機這種移動設備將每個人連接至互聯網上,每一台移動設備都可以是收集數據的平台。比如,人們在任何一款APP上的每一次點擊數據都可以用於數據分析,然後根據使用習慣進行用戶畫像。

其實我最早接觸到大數據是一篇英國的新聞,其通過海量數據分析查找恐怖分子嫌疑人。具體查找的方法就是通過對海量的數據進行分析,研究人員發現恐怖分子不購買保險,而在英國居住是不買保險是非常不明智的,而且英國福利很好保險的費用並不高。那恐怖分子為什麼不買保險呢,是因為恐怖分子買了保險也不能獲得任何賠償啊,保險免責條款里規定了恐怖分子因為參與恐怖襲擊而死亡不能獲得賠償。當時看完這個報道,就覺得生活中的變化都是可以通過數據進行分析的,我們就可以通過數據洞察世界。當然也有可能我們的分析不能得出有效的結論,我想有兩種可能性:1、我們獲取的用以分析的數據還不夠完備;2、對數據的分析還不夠徹底。

以上只說明了數據分析的重要性,和我個人對數據分析的一些看法。下面簡單介紹下入門數據分析的方法,最終k可以獨立完成數據分析的小項目,通過數據洞察世界的變化。

  1. 通過《深入淺出統計學》熟悉統計學的基礎知識。目標:建立一個知識框架,建立自己的統計學思維。如果後續學習中,遇到統計學相關的問題再返回來深入學習。
  2. 學習一門數據分析語言。鑒於Python在人工智慧、數據分析領域比較流行,以python為語言學習的主線,並簡單了解R語言。目標:理解python基礎語法,會使用python編寫程序,能讀懂R語言程序。
  3. 通過《深入淺出SQL》學習SQL語言,因為很多數據存儲在資料庫里,需要SQL把數據讀取出來。目標:會使用SQL語言讀取、寫入數據等。
  4. 通過大量的實踐學習數據分析演算法,和鞏固上述各方面的基礎知識。因為基礎知識的學習太無聊了,很容易就從入門到放棄了。那麼我們需要一些實踐來激勵自己,每一次實踐的成功都會帶來極大的快感,激勵自己完成更高階的實踐。

推薦閱讀:

數據分析第一關:初入數據之門
pandas(一) 數據結構
Records for Pandas(1): Basic function and property of Series
數據分析師的職業規劃

TAG:數據分析 | 數據挖掘入門 |