誰才是中式快餐業的扛把子!!
26 人贊了文章
一直以來,肯德基、麥當勞都是毫無疑問的快餐業巨頭,那民族快餐呢?
老美有蘋果,咱們有華為,韓國有現代,咱們有紅旗,日本有小電影,咱們有爛劇……為啥在中國人最驕傲的吃上面沒有交出一份滿意的成績單呢?
刷微博看到一個老段子:找出中國的餐飲業的四大巨頭,不服就撕!
評論里那是一個熱鬧啊,唇槍舌戰,水深火熱、熱火朝天,紅紅火火,恭賀新年…好像哪裡有些不對,反正大家各執己詞,說出自己心目中的餐飲業巨頭。但是幾個版本下來,蘭州拉麵和沙縣小吃是毫無疑問的當選。
那麼:
中國的快餐業情況到底是什麼樣的呢?
我帶著疑問進行了探究。
首先對找到了一份全國小吃餐飲店的txt格式的數據,
一共有『門店名稱,省,市,區縣,分類』這五個欄位
然後我使用pandas,matplotlib,pyechart和powerbi等對數據進行處理和可視化展示:
1.啟動jupyter
2.導入模塊(有部分模塊是做其他項目時使用,此次項目未使用)
import numpy as npimport pandas as pdimport matplotlib.pyplot as pltfrom pandas import DataFrame,Seriesfrom pylab import *import refrom wordcloud import WordCloudimport numpy as npimport jiebafrom PIL import Imagefrom pyecharts import Bar,Line,Overlap,EffectScatter,Mapplt.rcParams[font.sans-serif]=[SimHei]plt.rcParams[axes.unicode_minus]=False
3.讀取數據
f = open("小吃門店列表.txt","r") #設置文件對象data = f.readlines() #直接將文件中按行讀到list里f.close() #關閉文件data
ps:因為數據量有些大,使用常規方法讀取會報錯讀取中斷
轉換成DataFrame
data=pd.DataFrame(data)data
4.數據清洗
a=data[0].str.split( ).apply(pd.Series)a.columns=[門店名稱,省,市,區縣,分類]a=a[1:] a[分類]=a[分類].str.replace(
, )a.head(10)
重新命名列明,原先的列明不要,從第二條數據開始取
對欄位里的 和
進行替換
b=a.groupby(a[分類]).size()plt.bar(b.index,b.values,label=各小吃門店數量,color=m)plt.xlabel(數量)plt.ylabel(小吃品牌)plt.legend()plt.show()
plt.pie(b.values,labels=b.index,startangle=90,shadow=True,explode=(0.1,0,0,0,0,0,0,0),autopct=%.1f%%)plt.show()
b=a.groupby(a[分類]).size().sort_values(ascending=False)b
從以上可視化圖形我們可以明顯的觀察到,蘭州拉麵以約39000家的數量成為中式快餐的No.1
前八名分別是蘭州拉麵、沙縣小吃 、黃燜雞米飯、灌湯包、重慶小面、臘汁肉夾饃 、桂林米粉、鴨血粉絲湯
接下來,我們來探究下各個城市快餐的數量問題
b1=a.groupby(a[省]).size()b1=b1[b1.values>200]b1b1=b1.sort_values().tail(12)b1
因為澳門、香港的此類中式快餐數量很少,所以我直接忽略
plt.scatter(b1.index,b1.values,label=各個城市小吃店數量,s=b1.values/50,color=g)plt.xticks(np.arange(12), (上海,安徽,山東 ,廣東,廣西,江蘇,河北,河南,浙江,湖北,福建,陝西), rotation=40)#rotation控制傾斜角度plt.xlabel(區域)plt.ylabel(數量)plt.legend()plt.show()
使用matplotlib畫了一份關於各省快餐店數量的散點圖
從圖中,我們很明顯的發現,廣東省的快餐店數量是最多的。這也間接的證明了廣東人在「吃「這個天賦的上的優勢
接下來,本想使用pyechart的Map,但是發現Pyechart 有個很大的局限性,它不能識別正式的行政區,such as:可以識別廣西,但是識別不了廣西壯族自治區,可以識別上海,卻不能識別上海市,因為省級行政區有限,所以我對行政區的名字進行了清洗。
b2=a.groupby(a[市]).size()b2a[省份]=a[省]a[省份]=a[省份].str.replace(省,)a[省份]=a[省份].str.replace(壯族自治區,)a[省份]=a[省份].str.replace(維吾爾自治區,)a[省份]=a[省份].str.replace(回族自治區,)a[省份]=a[省份].str.replace(自治區,)a[省份]=a[省份].str.replace(市,)ab3=a.groupby(a[省份]).size()b3=b3[b3.values>200]b3
使用Map
value = list(b3.values)attr = list(b3.index)map1 = Map("全國地圖示例", width_=800, height=600)map1.add("", attr, value, maptype=china,is_visualmap=True,visual_text_color=#000,is_label_show=True,visual_range=[0,22000])map1
地圖上,東部沿海省份的顏色明顯區別於內陸,因為東部地區經濟發達且人口密集,更容易做生意賺錢,大家也更喜歡在東部開快餐店
從powerbi上的著色地圖分布來看,南沙群島亦有分布,可見中國餐飲這8大金剛的分布範圍之廣,覆蓋人群之多。
因為圖很多,就選放了快餐店數量最多的前五個省份,看看每個快餐品牌在省份的中佔比情況。結果有些出乎我的意料,一直以為南米北面,但是實際上蘭州在南方各的省份的佔比都是很大,和黃燜雞米飯幾乎評分天下,我以為江南地區愛吃的湯包卻在長江以北,山東等各省份的佔比有明顯的提升。
如果僅以以上數據片面來說,南北飲食習慣已經發生了重大的改變
如果從各個縣區的快餐店數量來看,東部各省內區縣的快餐店數量已經很高,快餐店數量最多的是蘇州的虎丘區,有259家快餐店,而上海,北京等一線城市的區域佔有量卻不高,說明在一線城市,此類中式快餐並不具有很大的競爭優勢,可能洋快餐更吸引都市上班族。
現在我們可以很明確的告訴大家了:中國快餐業的扛把子就是推廣了幾十年,風靡中國的「蘭州拉麵」,「沙縣小吃」,「黃燜雞米飯」緊跟其後。
美國家有快餐兩巨頭,中國有小吃三兄弟!!
推薦閱讀: