大眾點評數據分析
開通專欄的第一篇文章,這是前些日子做的關於tableau可視化的一個東西,感謝@路人甲提供的數據。今天寫這篇文章也是為了記錄自己在學習tableau的過程,不然過著過著,總感覺自己什麼東西都沒留下。
這個數據是大眾點評網上的一些數據,這篇文章主要使用tableau對這些數據進行分析,以期望能從中發現一些有用的東西。
一、商家與美食
1.城市分布
城市在地圖上的分布,可以看到我國南北方的城市均有統計,數據可信度還是比較高的。圖中顏色越深的,說明平均消費水平越高,明顯的,北京、上海依然遙遙領先其他城市。當然、這個圖形看上去並不是特別的直觀,我們就做了下一個圖表以更加清晰的方式解讀消費水平的差異。
2.商家數量
上圖反應的是大眾點評上一二線城市,美食商家入駐平台的數量。北京、上海、深圳分別位列前三,這也說明了020發展模式在這些較發達城市有著更高活躍度,發展規模也較大。
商家數量平均值為11萬家。
3.城市商家數量和美食類型
城市. 顏色顯示 美食類型計數 不同計數。 大小顯示 記錄數 總計。 標記按 城市 進行標記。
樹狀圖大小表示城市美食數量,顏色深淺代表該城市美食種類的數量。天津的商家雖未進前五,但是美食種類卻位列第二。
二、人均消費
1.最鍾愛的美食類型
平常寫Python爬蟲做數據分析的時候,習慣做個詞雲圖,這在tableau裡面就比較簡單了。
看來麵包甜點、火鍋、西餐是大家的最愛嘛。
2.人均消費和評價指數
每個 美食類型 的 平均值 人均消費 與 平均值 評價指數。 顏色顯示有關 平均值 人均消費 與 平均值 評價指數 的詳細信息。
該圖反映的是人均消費和評價指數的關係,從圖中可以看到幾個特殊的條形圖,分別是小吃、麵包和麵食,這三者的消費金額雖然不高,但是評價指數卻遠超人均消費水平。
3.人均消費和綜合指數
從雙軸圖中可以看到,人均消費高的美食和其評分並不呈現正相關關係,說明對於美食而言,並不是越貴的越好。比如對於北京而言,火鍋可謂是受到普遍人群的喜愛,評分居於第一位。
三、三種指數
1.口味指數和環境指數關係
美食類型 的 平均值 口味指數 與 平均值 環境指數 的趨勢。
從圖中可以篩選出兩個點,其中本幫江浙菜和日本菜評分都很高,
除此之外,從圖中雙軸折現圖中可以看出,基本上口味指數和環境指數呈現正相關趨勢。這能不能說明環境對顧客的食慾有促進作用呢?
2.三個指數
通過上一張圖,進一步對四種指數進行分析。
折線圖表示口味、服務和環境指數,三者基本上呈現正相關關係。
同時,將評價指數放進來,可以發現,儘管有些美食的三指數很高,但是顧客的評價分數卻不高。
3.評價數量和評價指數
每個 美食類型 的 評價數量 總計 與 評價指數 平均值。 對於窗格 評價數量 總計: 顏色顯示有關 城市 的詳細信息。 對於窗格 評價指數 平均值: 標記按 評價指數 平均值 進行標記。
火鍋看來是全國人民的最愛了。
同時通過評價數量可以看出評價指數的可信程度,評價技術越大,可信度越高。
也可以看到,有些菜品屬於小眾菜,雖然評價數量少(可相當於銷售量較少),但是評價卻不低。
第一次寫tableau的分析文章,文筆不好,多多見諒,目前作者也是處於學習階段,記錄過程,與君共進。在學習tableau的過程,發現網上關於tableau的文章還是比較少的,所以未來有打算抽時間寫個tableau作圖的基本教程,以使新手快速上手tableau。
one more question:
知乎上怎麼把寫好的markdown文本直接發布?
如有建議,歡迎討論
如有問題,還望批評指正。
個人博客:大眾點評數據分析 - Yangs Blog
推薦閱讀:
※Viz teardown | Race to Alaska
※Tableau 表計算 | 從屬計算與重啟間隔
※致敬Hans Rosling - 經典數據可視化作品是如何煉成的
※從桑基圖的一些展開分析
※Tableau 儀錶板 | 按這幾項做了 你的儀錶板就不會差 1