數碼相機銷售情況分析
08-21
數碼相機銷售情況分析
推薦閱讀:
來自專欄猴子聊數據分析
一、準備數據
使用爬蟲爬取某電商平台關於數碼相機的近一個月的銷量情況,數據包含:商品名稱、銷售價格、銷售數量、評論數量、在售商家數量。爬取的數據共計721條。
二、提出問題
問題是我們分析的「北極星目標」,一切分析都是為了解決問題,所以我們要先明確問題,這對後面的步驟,包括數據清洗、處理和可視化都非常關鍵,問題指引著我們接下來的操作。
關於數碼相機的問題:
- 相機種類的分布情況
- 各個品牌的市場份額
- 店家該如何尋找機會
關於相機品牌的問題:
品牌的市場份額如何。
關於店家如何尋找機會:
銷量與銷售額與店鋪數量之間的關係。
三、數據清洗
剛爬取的數據並不適合直接作分析,通過數據清洗,提取出分類標籤,可以通過更好的組合數據進行展示,
清洗過程包括:
- 列的重命名
- 去重、缺失值處理
- 數據一致化處理(包括欄位的提取,格式的統一)
- 異常值處理
清洗過程不再贅述,詳情可看:用Excel進行簡單數據分析的演練
清洗完的數據:
四、構建模型(分解問題)
這一步就是針對我們需要分析的問題,進行數據的提取。
關於第一個問題,將其拆分為
一、產品種類的分布情況
- 相機都有哪些品類,其銷量分布如何?
- 相機的供給與需求的分布如何?
- 各類相機的級別佔比如何?
- 熱銷的型號?
二、各品牌的市場佔比如何?
- 各品牌的銷量、銷售額如何分布?
- 品牌 綜合排名
三、店家該如何尋找機會
- 品牌的銷量與在售店鋪的關係
明確好問題之後,接下來開始進行分析,使用MySQL對數據進行提取,然後使用Excel製圖。
導入Navicat的MySQL環境中:
五、可視化
推薦閱讀:
※Python數據分箱,計算woe,iv
※數據分析師之路開始啟程
※獨家發布:2016年度中國酒店品牌發展報告精華版
※上班一個月掙10萬,居然全靠它...
※TMDb電影票房分析 & 電影評分預測器