數據分析學習筆記1:數據挖掘基礎知識點思維導圖總結
最近在看《Python數據分析與挖掘實戰》,加上一些自己的理解,大致梳理一下數據分析,數據挖掘的流程,還有基本知識點,用一張圖片就基本概括了數據挖掘基礎,歡迎保存。
數據分析挖掘基礎知識點概括,並且以餐飲企業數據分析挖掘為案例。
文字版:
一、數據挖掘基礎
1.1某連鎖餐飲企業的困惑
現況
- 員工一千多名(企業大)
- 16家直營分店(控制力足夠)
出現的問題:
- 各方面成本急劇升高
- 整個行業利潤率下降嚴重
已上線管理系統
- 客戶關係管理系統
- 前廳管理系統
- 後廚管理系統
- 財務管理系統
- 物資管理系統
1.2從餐飲服務到數據挖掘
經營者經驗總結:
- 由有經驗的服務員根據顧客特點進行菜品推薦
- 根據歷史銷售情,考慮節假日、氣候和其他因素,對菜品銷量預測,提前準備材料
- 定期對菜品銷售情況進行統計,分類統計好評菜和差評菜,為促銷活動和新產品推出提供支持
- 根據就餐頻率,顧客評分,篩選優質客戶,針對性提供優惠
1.3數據挖掘的基本任務
數據挖掘定義:數據挖掘一般是指從大量的數據中通過演算法搜索隱藏於其中信息的過程。
數據獲得辦法:外部數據和內部數據
外部數據:
- 天氣
- 節假日
- 競爭對手
- 周邊商業氛圍
內部數據:
- 成本單價
- 菜品銷量
- 會員消費
- 促銷活動
數據挖掘基本任務
- 分類與預測-菜品銷量預測
- 聚類分析-客戶價值分析
- 關聯規則-促銷效果分析
- 時序分析
- 偏差檢驗
- 智能推薦-菜品智能推薦
1.4數據挖掘建模過程
1.定義挖掘目標
理解:
- 針對具體的挖掘需求,首先要明確挖掘目標!系統完成後是在什麼樣效果?
- 餐飲行業數據挖掘過程
目標定義:
- 任務理解
- 指標確定
數據採集:
- 建模抽樣
- 質量把控
- 數據變換
數據整理
- 數據探索
- 數據清洗
- 數據變換
構建模型
- 模式發現
- 構建模型
- 驗證模型
模型評價
- 設定評價標準
- 多模型對比
- 模型優化
模型發布
- 模型部署
- 模型重構
挖掘目標確定
- 實現動態菜品智能推薦,使得客戶快速發現感興趣菜品
- 對餐飲客戶進行細分,實現精準營銷,最大化資源利用
- 基於菜品歷史銷售情況,綜合考慮節假日、氣候和競爭對手等影響因素,對菜品銷量預測,方便準備材料
- 基於餐飲大數據,優化新店選址,對所在位置的潛在客戶口味偏好進行分析,方便菜式調整
2.數據取樣
理解
明確目標後,接下來需要獲得與數據挖掘目的相關的樣子數據子集。抽取數據有三個標準。數據取樣,一定得嚴格控制質量,如果原始數據出錯,後面的工作都會報廢。
數據標準
- 相關性
- 可靠性
- 有效性
取樣數據質量標準
- 資料完整無缺,各項指標齊全
- 數據準確無誤,反映的都是正常(而不是異常)狀態的下的水平
獲得數據後,再進行抽樣操作
- 隨機抽樣
- 等距抽樣
- 分層抽樣
- 從分類抽樣
確定數據具體來源
- 餐飲企業信息:名稱、位置、規模
- 餐飲客戶信息:姓名、聯繫方式、消費時間金額
- 餐飲企業菜品信息:菜品名稱、單價、成本、銷量
- 菜品銷量數據:名稱、日期、金額、數量
- 材料供應商資料:供應商姓名,聯繫方式,商品名稱
- 促銷活動數據:促銷日期,內容,描述
- 外部數據:天氣,節假日,競爭對手和周邊商業氛圍
數據探索
理解
數據探索就是通過檢驗數據集的數據質量、繪製圖表、計算某些特徵量等手段,對樣本數據集的結構和規律進行分析的過程。
具體介紹後面補上
- 數據質量分析
- 數據特徵分析
- 異常值分析
- 相關分析
- 周期性分析
4.數據預處理
- 原始數據存在問題
- 不一致
- 重複
- 含雜訊
- 維度高
處理辦法
- 數據清洗
- 數據集成
- 數據變換
- 數據規約
5.挖掘建模(核心)
理解
- 本次建模。屬於數據挖掘應用中哪類問題,選用那種演算法建模?
- 模型的具體化就是公式
後面補上,參照1.3
6.常用挖掘工具
- Python
- R
- SAS
- SPSS
6.小結
從一個餐飲企業存在困惑出發引出了
- 數據挖掘的概念
- 基本任務
- 建模過程
- 常用工具
———————————————————————————以上。
對於數據分析挖掘的各個大點,後面會繼續給出更為詳細的解釋與總結。
關注以後會繼續更新。
我會繼續學習和總結,希望能給你帶來一些幫助。
與大家共勉,繼續努力!歡迎私信交流~
覺得這篇文章對你有幫助的話,幫忙點個贊~
這也是我動力的來源,謝謝各位。
這裡有個Q群541809771,由 @路人乙 創建,群里有許多人正在學習的路上,歡迎各位前來討論,互相監督,互相進步。群里每天都有人活躍~
最後,祝各位天天好心情~!
推薦閱讀:
※黃哥分析如何用python解決特殊文本文件問題
※計算化學,有python基礎還有必要學習matlab么?
※爬蟲入門到精通-mongodb的基本使用
※[16] Python循環語句(三)