大眾點評網口碑影響因素分析
目錄
1.問題背景
2. 數據描述
(1)數據概覽
(2)各列數據分布
3. 環境、口味和服務和好評率的關係
(1)散點圖初步描述
(2)口味、環境、服務對好評率影響的方差分析
4. 特色服務和好評率的關係
(1)不同特色服務下商家好評率的分布
(2)特色服務和好評率的獨立樣本T檢驗
(3)團購對好評率影響的協方差分析
5. 停車信息對好評率的影響
(1)是否有停車信息下商家好評率的分布
(2)停車信息對好評率影響的協方差分析
6. 人均消費額對好評率的影響
(1)人均消費額和好評率的散點圖
(2)人均消費額和好評率的相關分析
7. 結論
1. 問題背景
根據從大眾點評網站採集的211家粵菜的數據來研究影響商家好評率的因素:商家的好評率是給出好評的人數占所有評論人數的比例,而採集的可能影響好評率的因素包括:環境評分、服務評分、口味評分及一些特色服務(如團購、促銷等)。通過利用SPSS的描述統計、獨立樣本的T檢驗、方差分析和協方差分析等方法根據已獲得的數據分析影響商家網上口碑的主要因素。
2. 數據描述
(1)數據概覽
用簡單的Python爬蟲從大眾點評網上獲得的數據如下:
- Res_ID:表示商家的ID
- flavor:大眾點評網上的表示商家的口味評分
- environment:大眾點評網上的商家的環境評分
- service:大眾點評網上的商家的服務評分
- rating:表示商家的好評率(%)
- grouppurchase:表示商家是否提供團購服務:0表示不提供,1表示提供
- promotion:表示商家是否提供促銷:0表示不提供,1表示提供
- reservation:表示商家是否提供提前預定的服務:0表示有,1表示沒有
- takeout:表示是否提供外賣服務:0表示沒有,1表示有
- CPP:人均消費額
- parkingInformation:表示是用戶評論中否有停車信息:0表示沒有,1表示有
(2)各列數據分布
① 連續性型變數:商家好評率、口味評分、環境評分、服務評分、人均消費額。
- 大部分商家的好評率在50%左右,且好評率小於50%的商家數量要大於好評率大於50%的商家的數量
- 口味、環境和服務評分大都在7-9這個分數段,基本上沒有很低的評分出現
- 人均消費額在100的居多
② 二分變數:從左到右分別表示團購、促銷、提前預定、外賣和停車信息的分布,藍色部分代表不提供這些服務,綠色部分代表提供該項服務:
- 大部分商家都不提供促銷、提前預定和外賣服務
- 提供團購服務的商家較多。而有停車信息的商家的比例很高,由於是否有停車信息是從用戶的評論中得到的,說明用戶還是比較關心商家的停車問題的。
3.環境、口味和服務和好評率的關係
(1)散點圖初步描述
從上面的散點圖中可以得到以下的結果:
- 環境和好評率:隨著環境評分的上升,好評率也有所提高,說明環境可能會影響到商家的好評率。
- 口味和好評率:數據基本均勻分布,推測口味和好評率之間不存在相關係。
- 服務和好評率:隨著服務評分的上升,好評率也有所提高,且呈較強的線性關係,因此推測服務也會影響到好評率。
(2)口味、環境、服務對好評率影響的方差分析
首先根據口味、環境和服務評分是否大於8分別將其分組,每組有兩個變數:評分較好的組和評分較差的組,然後利用SPSS中的方差分析功能來進行分析。
方差分析需要滿足兩個條件:分組之後的變數要符合正態分布、方差齊次。而根據服務的好壞進行分組之後的好評率不滿足方差齊次的條件,因此不適用於方差分析,可以改用獨立樣本的T檢驗來檢驗不同組之間的好評率均值是否有顯著差異。
由上面檢驗的結果可以得到以下的結論:
- 環境對好評率的影響:F統計量=2.226,顯著度p=0.137>0.05,因此接受原假設,即環境的評分對商家好評率沒有影響。
- 口味對好評率的影響:F統計量F=22.965,顯著度p=0.000,說明口味對好評率的影響是顯著的。而且口味評價高的商家的均值(54.51)遠高於口味評價差的商家的好評率均值(41.56),說明口味越好,商家的好評率越高。
- 服務對好評率的影響:t統計量=-8.479,顯著度p=0.000<0.05,說明服務對商家好評率的影響是顯著的。而且服務好的商家的好評率均值(58.81)遠大於服務差的商家的均值(45.71),說明商家服務越好,好評率越好。
4. 特色服務和好評率的關係
(1)不同特色服務下商家好評率的分布
從上面的圖中可以看出:有提供特色服務的商家的好評率似乎要比沒有提供特色服務的商家要高,而且其中很明顯的就是促銷和團購,可以推測這兩項會對商家的好評率產生顯著的影響。
(2)特色服務和好評率的獨立樣本T檢驗
各項特色服務都是二分變數,因此可以用獨立樣本的T檢驗來檢驗不同分組下好評率的差異,從上圖T檢驗的結果來看,有以下的結論:
- 結果表明只有團購的顯著度p=0.001<0.05, 因此在特色服務中,只有團購是對商家的好評率有顯著影響。
- 而且有團購的商家的好評率要顯著高於沒有團購的商家的好評率。
(3)團購對好評率影響的協方差分析
通過獨立樣本的T檢驗得到了是否提供團購服務對商家的好評率是有影響的,但是這種影響很可能是由商家的口味或服務評分帶來的,因此為了準確得到團購究竟是否會影響好評率,還應該去掉口味和服務的影響。
因此我將口味和服務的均值作為該商家的綜合評分,並把這個綜合評分作為協變數進行協方差分析,分析得到的結果如下:
從上面的可以看出:綜合評分的的p=0<0.05,說明它的確會對好評率起到顯著的影響作用,而在去除了綜合評分之後團購的p=0.007<0.05,說明團購的確會對好評率起到影響作用,而不是受到口味或服務的影響。
5. 停車信息對好評率的影響
(1)是否有停車信息下商家好評率的分布
從上面的圖形來看,有停車信息的商家的好評率似乎要顯著高於沒有停車信息的商家。
(2)停車信息對好評率影響的協方差分析
同分析特色服務的影響一樣,對停車信息進行協方差分析,將綜合評分作為協變數,得到的結果如下:
上圖的結果表明:在排除了口味和服務的綜合評分對好評率的影響之後,是否有停車信息會對商家的好評率產生影響。且有停車信息的商家的好評率均值(51.026)要小於沒有停車信息的商家的好評率均值(58.506)。
這個結論很有意思,一般我們以為如果用戶的評論中有提供停車的信息的話,用戶對商家的好評率應該會相對較高,而這與得到的數據相悖。回到大眾點評網查看了一些商家的停車信息之後發現得到這樣的結論其實也很合理:
- 首先,這些停車信息是由用戶提供的,表達他們對該商家附近停車情況的評論,而不是商家自己提供的停車情況。因此,有關於停車信息的評論只能說明用戶曾經評論過停車的情況,而不是說明該商家附近有可以停車的地方。
- 其次,用戶對商家的停車情況的評論大多都是消極的,說明他們對商家附近的停車情況很不滿意,這也可能間接影響到了對商家的好感,從而影響到了好評率。
6. 人均消費額對好評率的影響
(1)人均消費額和好評率的散點圖
從上面的散點圖中可以得到兩個信息:一個是商家的人均消費額集中在100左右,高於300的很少,說明採集的商家中大部分還是比較小型的。第二個是人均消費額和商家的好評率之間沒有明顯的相關關係,人均消費額可能不會影響到商家的好評率。
(2)人均消費額和好評率的相關分析
人均消費額是連續性變數,就可以直接用相關分析的方法來得到人均消費額和好評率之間的相關關係:
從上面的結果中可以看出,人均消費額和商家好評率的相關關係不明顯(p=0.08>0.05),說明人均消費額不會影響到商家的好評率。
7. 結論
通過以上對影響大眾點評網影響因素的分析,可以得到以下的結論:
- 口味和服務都會影響到商家的好評率,口味和服務的評分越高,好評率越高。環境不會影響到好評率。
- 在團購、促銷、提前預定和外賣中,只有團購對商家的好評率有影響,提供團購的商家好評率較高。
- 商家信息中是否有停車信息也會影響到好評率,且有停車信息的商家的好評率要低於沒有停車信息的好評率。
- 人均消費額不會影響商家的好評率。
因此,做為一個商家,為了提高自己的好評率(網路口碑),可以從口味、服務和團購上面下手,改善食品的口味、提供周到且令人滿意的服務和提供團購服務。
推薦閱讀:
※《專利審查指南修改草案》將圖形用戶界面(GUI)納入外觀設計專利範圍內,這改變意味著什麼?
※在業務分析中實現商業洞察 – Excel商業智能分析報表「玩」法介紹
※商品管理就是做決策!鞋服商品管理要這麼干
※數據可視化-電影分析
※MySQL 進階——SQL ZOO 練習