從數據角度解析福州美食
GitHub - SmileXie/dianping_crawler: Crawler of dianping.com
用python3來收集數據,用MySQL來保存、分析數據,編碼中用到了幾個Python庫:Requests, Beautifulsoup, MySQL Python connector.。數據樣本數據樣本來源於大家熟知的「大眾點評」,收集了其中7740家福州餐廳的數據。其中,包含以下特徵之一的數據,我認為是無效的數據,予以剔除:- 點評星級為0
- 人均消費大於3000
福州最貴餐廳TOP20
把所有餐廳按人均消費排序:mysql> select id, name, branch_name, price, category, district from ResTable order by price desc limit 20;
mysql> select count(*) from ResTable where price >= 200; mysql> select count(*) from ResTable where price < 200 and price >= 100; mysql> select count(*) from ResTable where price < 100 and price >= 30;
mysql> select district, count(*) from ResTable group by district order by count(*) desc limit 30;
值得注意的是,吃貨商圈top10中,有兩個是位於閩侯縣。也說明閩侯大學城區塊正在逐漸融入市區,有很大的發展潛力。
福州的高富帥商圈上面統計了各大商圈的餐廳的「量」,以下來統計一下「價」。看看了解一下福州各大商圈中,哪個才是「高富帥」商圈。mysql> select district, avg(price) from ResTable where district = xxxx and price > 0;
綜合統計上述各大商圈的餐廳的人均消費,如下:
五四路商務區是高端白領聚焦地,一舉奪下福州最「高富帥」商圈稱號。而位於閩侯上街區塊的博仕後與新西客站,雖然在餐廳的「量」上擠入了福州top10商圈,但仍難以擺脫低端印象,在人均消費均價上排名墊底。「學生街」所在的福建師大商圈,聚焦了大量的小吃,人均消費也不會太高。分店最多的連鎖餐廳mysql> select name, count(*) from ResTable where price > 20 group by name order by count(*) desc limit 30;
「三九」餐廳
所謂三九餐廳,是指口味、服務、環境評分都在9.0(包含9.0)之上的餐廳。mysql> select name, branch_name, taste, service, surroundings, price, star from ResTable -> where taste >= 9.0 and service >= 9.0 and surroundings >= 9.0 order by price;
推薦閱讀:
※福州和閩南的知名度哪個高?
※為什麼福州的內河始終治理不好,大部份內河都是又臟又臭?
※如何表現得像在福州呆過很久的樣子?
※如何評價位於福州長樂地區的濱海新城?
※如何評價福州這個城市?