標籤:

數碼相機銷售情況分析

數碼相機銷售情況分析

來自專欄猴子聊數據分析

一、準備數據

使用爬蟲爬取某電商平台關於數碼相機的近一個月的銷量情況,數據包含:商品名稱、銷售價格、銷售數量、評論數量、在售商家數量。爬取的數據共計721條。

二、提出問題

問題是我們分析的「北極星目標」,一切分析都是為了解決問題,所以我們要先明確問題,這對後面的步驟,包括數據清洗、處理和可視化都非常關鍵,問題指引著我們接下來的操作。

關於數碼相機的問題:

  1. 相機種類的分布情況
  2. 各個品牌的市場份額
  3. 店家該如何尋找機會

關於相機品牌的問題:

品牌的市場份額如何。

關於店家如何尋找機會:

銷量與銷售額與店鋪數量之間的關係。

三、數據清洗

剛爬取的數據並不適合直接作分析,通過數據清洗,提取出分類標籤,可以通過更好的組合數據進行展示,

清洗過程包括:

  1. 列的重命名
  2. 去重、缺失值處理
  3. 數據一致化處理(包括欄位的提取,格式的統一)
  4. 異常值處理

清洗過程不再贅述,詳情可看:用Excel進行簡單數據分析的演練

清洗完的數據:

四、構建模型(分解問題)

這一步就是針對我們需要分析的問題,進行數據的提取。

關於第一個問題,將其拆分為

一、產品種類的分布情況

  1. 相機都有哪些品類,其銷量分布如何?
  2. 相機的供給與需求的分布如何?
  3. 各類相機的級別佔比如何?
  4. 熱銷的型號?

二、各品牌的市場佔比如何?

  1. 各品牌的銷量、銷售額如何分布?
  2. 品牌 綜合排名

三、店家該如何尋找機會

  1. 品牌的銷量與在售店鋪的關係

明確好問題之後,接下來開始進行分析,使用MySQL對數據進行提取,然後使用Excel製圖。

導入Navicat的MySQL環境中:

五、可視化


推薦閱讀:

Python數據分箱,計算woe,iv
數據分析師之路開始啟程
獨家發布:2016年度中國酒店品牌發展報告精華版
上班一個月掙10萬,居然全靠它...
TMDb電影票房分析 & 電影評分預測器

TAG:數據分析 | SQL |