數據分析告訴你,宜居城市有哪些?

前言

「宜居城市」是每位城市建設者都想達成的目標,也是我們選擇定居場所的關鍵因素。本文通過數據挖掘與數據可視化來對國內各省市的宜居指數進行綜合分析,找出國內「宜居指數」最高的城市,從而為將來的創就業、求學等提供一些參考。

目前該部分僅為Part1,包含教育、醫療、經濟等方面的數據,後期會不斷更新Part2,Part

3...

正文

筆者認為,判斷一個城市宜居與否,主要取決於以下指標:

  • 教育(本文主要分析指標為「該省高校總數」「該省985 211重點大學數量」
  • 醫療(本文主要分析指標為「該省醫院總數」「該省三甲醫院數量」
  • 經濟(包括 薪資待遇、GDP、三大產業的佔比
  • 房價(因省內不同市區房價往往會存在很大差異,本文僅考慮省會城市房價中位數)
  • 治安(本文主要分析指標為 犯罪率
  • 環境(本文主要分析指標為 PM2.5指數、AQI;以及一年內多少天為雨天/晴天夏季/冬季 平均溫度等)
  • 交通(地鐵數量;機場數量)
  • 城市印象(本文通過抓取新浪微博平台網友對該地區的微博文字,利用自然語言處理技術獲取印象熱度關鍵詞地區情感打分
  1. 教育篇

在作者眼裡,「教育」幾乎是最重要的因素了,個人認為這是一項投資收益最高的「項目」之一。所以開篇從 教育 開始分析。

  • 各省市高校數量

聲明:根據學信網數據,此處高校數量指的是「位於某地的高校(包含其他名校的分校等)」而非傳統意義上「與升學錄取相關的高校數量」。

可以看到,江蘇、廣東、山東、河南、湖北、河北、安徽、湖南、遼寧 是高校數量最多的省份。

  • 重點大學數量省份排行

北京市29所 「211高校」位居榜首,排在第2位的是江蘇——12所;第3位是上海——11所;第4位是 湖北陝西 ——均為7所;第5位是 山東遼寧 ——均為5所。

北京10所 「985高校」位居榜首;上海6所 位居第2;山東4所 位居第3位。

  • 人口密度

廣東、山東、河南、四川 是人口密度最高的省。結合上文提及的重點院校數量排行,對於一些人口大省如河南省而言,考上重點大學的難度可想而知。

2. 醫療篇

筆者認為,城市的「醫療資源」是否充足,也是一項極其重要的參考標準。雖說年輕時候身體好,但是對於老年人或小孩而言,醫療衛生方面尤其不容忽視。

爬取全國醫院數據(未包含部隊軍醫),使用Tableau繪製地圖熱力圖。

  • 醫院數量分布

其中,廣東、河北、江蘇、山東、四川醫院數量較多;而西藏、雲南、內蒙古、雲南等西部偏遠地區醫療資源則非常稀缺。

  • 三甲醫院熱力圖

可以看出,廣東、湖北、江蘇、遼寧、四川、北京 等地的三甲醫院數量是最多的。而西藏、寧夏、雲南、海南 等地的三甲醫院數量則非常稀少。

3. 經濟

  • 薪資排行

雖說「被平均」的現象使得平均薪資的可信度不高,但是考慮到極端富有與極端貧困的人數所佔比例較低,因此對於絕大多數普通家庭背景、受過高等教育的人群來說,「平均薪資」也不失作為一項參考。

可以看到,北京、上海、深圳 的薪資全國最高,其中北京以9240元位居榜首。

以北京為例,從春節前後北京市的遷入、遷出熱力圖可以看出,重慶、上海 是與北京來往最密集的城市。

  • 2017 上半年GDP排行

根據前段時間人民網發布的我國2017 上半年GDP數據可以看出,廣東、江蘇、山東 等地GDP總量最高。而 西藏、青海、寧夏 等西北地區總量最小。

但從GDP增速來看,西藏、重慶、貴州、雲南 等地則位於前列,尤其對於雲貴藏等本身經濟基礎十分薄弱的地區而言,這種增長是十分值得關注的。

Part 1 就先寫到這裡吧,有空會把後續幾點指標以及最終藉助機器學習演算法完成的 宜居指數 計算結果作為 Part 2 發布。歡迎感興趣的童鞋一起合作~

註:

  • 數據來源

1. 國家統計局

2. 中國高等教育學生信息網院校庫

3. 人民網

4. 騰訊位置大數據

  • 數據可視化

1. Tableau

2. 百度圖說

  • 數據採集

Python3.6 + Pandas

另:

對圖像識別感興趣的可以看這一篇:Python+機器學習 識別少兒不宜圖片

對數據分析感興趣的可以看這一篇:世紀佳緣用戶畫像-Part1


推薦閱讀:

讓你決定留在太原的原因是什麼?
請教大家,地下車位選哪個位置比較好?
如果你有台10萬塊錢的車,要不要花20萬買一個車位?
擺攤賣菜有何技巧?

TAG:数据分析 | 城市生活 | 数据可视化 |