標籤:

深入淺出數據分析的結構化總結

花了3小時,把深入淺出數據分析這本書讀完,並做了相應筆記,只能四個字形容自己的感受,受益匪淺。

  • 優秀的數據分析師:
    • 幫助客戶思考問題
    • 不會等客戶告訴他們該做什麼
  • Head First教學原則
    • 知識圖形化
    • 對話式的個性化風格
    • 吸引讀者的注意力
    • 引導讀者深入思考
    • 影響讀者的情感
  • 元認知 想學的快且深入,需要關注自己如何集中注意力,思考自己的思考方式,研究自己的研究方式

    • 訣竅:賦予正在學習的事情重大意義
    • how
      • 一種慢方法
        • 重複多次學習
      • 快方法
        • 做一切增加大腦活動的事情
          • 知識圖形化
          • 對話式的個性化風格,對話式寫作
          • 吸引讀者的注意力-反覆論述
          • 引導讀者深入思考
          • 影響讀者的情感-幽默,,新穎
  • 數據分析的四個步驟
    • 1確定問題

      • 數據分析師的客戶
        • 誰是客戶
          • ceo,上司等,需要從客戶多了解一些信息
        • 為什麼多了解客戶
          • 數據:客戶是否了解自己的數據
          • 目標(問題):客戶是否了解自己的問題
          • 業務:客戶是否了解自己的業務
          • 性格:客戶是否優柔寡斷
          • 善於分析否
      • 多問客戶問題
        • 問1:是否先在腦子裡形成問題才去瀏覽數據
          • 答:沒必要,但是,僅僅過一眼並不是數據分析,數據分析總的來說就是認清問題,以及繼而解決問題。
        • 問2:探索性數據分析,就是從數據中找出一些可能想進一步進行評估的點子,這種數據分析並沒有什麼「問題確定」步驟!
          • 答:在探索性數據分析中,問題就是要找到一些值得進行測試的假設條件,這完全是個具體的問題。
        • 不斷提問客戶問題
          • 希望的目標
          • 可行的目標
          • 競爭對手
          • 對一些數據的好奇
      • 2分解
        • 2.1對問題進行分解
          • 將含糊不清的大問題分解成可管理、可解決的小問題

        • 2.2對數據進行分解,即提煉因子,再進行比較
          • 如果拿到的是原始數據表,先匯總,再提煉因子
          • 找出重要的因子

        • 2.3將客戶的回答與自己的看法一條條列出
      • 3評估
        • 評估需要個人參與,參與代表負責

      • 4決策
        • 以報表形式展示,報表內容如下:
          • 背景
          • 數據解說+可視化
          • 分析師建議
        • 得到客戶理解,並鼓勵客戶以數據為基礎做決策

在報告寫好後,出現不確定性新聞

不確定事件

      • 心智模型
        • 心智模型決定你的觀察結果,
          • 心智模型優勢:用心智模型填補信息空白,通過經驗進行試驗
          • 心智模型劣勢:世界是變化,若心智模型不變化,則
          • 心智模型應當包括你不了解的因素, 考慮不確定因素及盲點,會讓人不爽,但回報顯著,你會小心防範並想方法填補知識空白,繼而提出更好的建議。
        • 統計模型取決於你的心智模型,

問題與心智模型

如果用了錯誤的心智模型,分析就會胎死腹中

      • 1再次確定問題(更新假設)

迭代中

      • 2再次分解問題(問題分解與數據分解到多因子)

迭代中

      • 3繼續評估(比較各因子)
      • 4繼續報告

數據分析的流程是迭代的過程

獲得收穫:

  1. 李笑來曾經提到的元認知;
  2. 數據分析的四個步驟;
  3. 心智模型決定分析結果,面對變化的世界,要反覆迭代。

推薦閱讀:

Stitch Fix:當數據遇到時尚
mysql查詢初級 50道練習題(語句親測無錯)
如何以數據有效驅動產品
NBA選秀十年記【2】—尋找相似的新秀
重走數據分析之路 R In Action

TAG:數據分析 |