多源數據帶你走進中國四大城市群的「吃貨大本營」
文/數據俠 徐凱恆
如何獲取多源數據並用於城市群識別?四大城市群中心城市之間的關聯度如何度量?各城市群中,哪裡的餐飲業才是數據視角下的「黑馬」?10月19日的數據俠實驗室線上活動中,來自「數讀城事」的數據俠徐凱恆,為我們分享了多源數據下的城市群結構,並結合數據剖析了核心城市的餐飲偏好,本文為其演講實錄。
本文轉自公眾號數讀城事(ID:CityDAst)
多源數據下的城市群結構
從全國主體功能區規劃開始,就已經開始提城鎮化地區的概念。
新型城鎮化規劃裡面提到,在《全國主體功能區規劃》確定的城鎮化地區,按照統籌規劃、合理布局、分工協作、以大帶小的原則,發展集聚效率高、輻射作用大、城鎮體系優、功能互補強的城市群,使之成為支撐全國經濟增長、促進區域協調發展、參與國際競爭合作的重要平台。構建以陸橋通道、沿長江通道為兩條橫軸,以沿海、京哈京廣、包昆通道為三條縱軸,以軸線上城市群和節點城市為依託、其他城鎮化地區為重要組成部分,大中小城市和小城鎮協調發展的「兩橫三縱」城鎮化戰略格局。
(圖片說明:2010年全國的公里格網的GDP分布)
從圖中可以看出,我們現在熟悉的京津冀、長三角和珠三角很明顯區域發展高於其他地區,從左面的人造地表覆蓋數據來看,這幾個地區的城市建成區有綿延連接的趨勢。
(圖片說明:人口的公里格網分布)
所以我找了更多的數據,進行疊加分析。
(圖片說明:POI點數據圖)
首先是POI的點數據,每一個點代表了一個設施要素,包括了醫療餐飲商業學校等,全國的話就是黑壓壓的一片,所以後期還需要處理,POI點的數據應該有很多案例了,這裡就不仔細說了。
還有鐵路公路之類的數據,原來的計劃是計算全國公路網密度,不過計算量有點大,最後沒有把這個要素放進去疊加。
計算設施,也就是POI的密度,主要是用了arcgis裡面的核密度分析工具,其實說實話,不同的設施點權重應該是不一樣的,放在同一個圖層上計算肯定是不對的,我就偷了個懶,把他們當作一樣的權重算了。
(圖片說明:POI密度數據圖)
燈光強度數據可以在NASA官網上下到,這個數據反映了人類夜間活動的強度,在某個程度上也可以作為反映經濟活力的指標。
(圖片說明:全國燈光數據圖)
人造地表覆蓋數據有幾個獲取渠道,最好的渠道就是通過遙感影像來識別,通過監督分類或者非監督分類都可以得到土地使用圖版,不過要在全國尺度做的話,還是要費點事的,此外,也有不少網站有提供,一般百度就可以找了。
(圖片說明:人造地表覆蓋數據圖)
我這裡是把人造地表覆蓋的數據矢量化了,然後計算了單位國土面積內建設面積用地的比例。
對於各類要素數據的處理,一般就是對他們的數值進行分級,對於這個分級,我一直覺得很難體現科學性,所以後期也思考了用回歸分析的方法得到要素權重而不是分級來計算,不過這裡就不仔細說了,因為本次分析也是採用了傳統的分級方法。
(圖片說明:最終疊加結果圖)
我們可以對照下十三五規劃中「三橫兩縱」的城市化戰略格局,不同的城市群發展規模還是存在很大的差距的,具體的政策上的事情不多說了。
接下來,我再通過航線聯繫的數據,來看看城市群中心城市之間的聯繫程度,這個怎樣度量呢?
我提供一個思路,首先從交通的通達性來度量,傳統的方法可以從不同城市之間客車的班次,現在也可以用高鐵班次,也可以通過工商企業的企業互投數據
舉個例子比如說,在京津冀城市群有個企業是在北京的,但是他投資保定,張家口,這樣的聯繫統計起來就可以得到城市群內的聯繫強度。
也可以通過別的,我以前也看到過有人用企業分公司的分布情況來得到這個聯繫性,其實聯繫性可以通過各種方式得到吧,只要發散去想就有很多方法。
有一個比較簡單的方法,就是每個中心城市為起點到達區域內其它城市的時間,如果很多中心城市在同一個城市群內,他們一小時等時圈都綿延在一起的話,那這個城市群的城市可以說是很緊密的了——我這裡只是提供一個思路,不一定很準確。
所以,哪幾個城市群之間的聯繫最為緊密?
如圖,通過航線的聯繫,可以看到京津冀、長三角、珠三角、成渝這幾個城鎮化地區聯繫最為緊密,從2016年機場客運吞吐量的統計來看,這幾個地區的中心城市北京上海廣州深圳重慶成都也都是排名靠前的。
總結下多源數據的獲取,部分宏觀數據可在國家統計局網站上獲取,另外一些分布數據可以從中國科學院地理科學研究所找到,有些網站需要申請,但是也是免費的,夜間燈光數據可以從NASA網站下載,POI數據可以很容易從百度、高德獲取。
哪座城市才是吃貨的「大本營」
接下來,我選擇了這幾個城市群內比較大的城市,對他們的地鐵站附近的餐飲分布做了一個簡單的描述分析。
地鐵線路和地鐵站點的數據算是比較好獲得的,這個還是2016年的數據,多少和現在有點不一樣。
我這裡將地鐵站1000米半徑的範圍作為分析的區域,為什麼選1000呢?說實話就是拍腦袋想的,不是有個概念是「最後一公里」么,這個概念的基礎是人的步行疲勞閾值是800米。
用地鐵1000米的範圍去裁剪整個地區的餐飲POI,就得到範圍內的餐飲點。從總量上來看呢,城市越大肯定餐飲服務越多,但這也不意味著同樣數量的餐飲可以服務更多人,所以需要用數量除以面積得到密度,但是城市邊界很難確定,於是乾脆用地鐵站1000米半徑作為一個範圍計算。
上圖中,左邊就是總量的分布,北京是看上去有很多餐飲店,但是從密度上來說,廣州、深圳就多很多了,從右邊的圖的排名來看呢,本來也沒有期待,但結論卻很有趣。
同一個城市群的城市排在一起,要不怎麼說廣東是吃貨的大本營呢,還有成都重慶也是名聲在外的,相比起來,北方的大城市就遜色很多了。
接下來其實就是一個對不同城市的不同餐飲類型描述了一下,因為我本人沒有重新分類,問題還是挺多的。
比較了不同城市,最後比較下車站範圍內的餐飲數量吧,也不知道是不是符合實際的印象。
最後給每個城市單獨排了個名。如果看不清我就說一下,每個城市周邊餐飲數量最多的地鐵站:
上海是人民廣場,杭州是高沙路,北京是東大橋,天津是營口道,成都是春熙路,重慶是觀音橋,廣州(因為廣州和佛山同城化,所以這裡放在一起)是黃埔大道,深圳是湖貝地鐵站。
註:以上內容根據徐凱恆在數據俠線上實驗室的演講實錄整理,圖片來自其現場PPT,關注DT數據俠後台回復「城市群飲食」,獲取完整PPT。本文僅為作者觀點,不代表DT財經立場。
期待更多數據俠乾貨分享、話題討論、福利發放?在公眾號DT數據俠(ID:DTdatahero)後台回復「數據社群」,可申請加入DT數據社群。
數據俠門派
本文數據俠徐凱恆,數讀城事公眾號創始人、職業規劃師,主要從事交通-產業-空間三要素協調規劃,除了長得帥,媳婦也特別漂亮。
數讀城事(CityDAst)這個公眾號就是他和媳婦兩個人在學生時代的時候一點點運營起來的,主要是想分享經驗與結交朋友,雖然規模不大,但是做得很用心。加入數據俠
「數據俠計劃」是由第一財經旗下DT財經發起的數據社群,包含數據俠專欄、數據俠實驗室系列活動和數據俠聯盟,旨在聚集大數據領域精英,共同挖掘數據價值。了解數據俠計劃詳情請關注DT數據俠回復「數據俠計劃」,投稿、合作請聯繫datahero@dtcj.com。
推薦閱讀:
※如果吃一小勺硫酸會怎麼樣?
※有哪些單純約飯的途徑?
※有哪些食品或菜肴是不愛國的?
※食鹽(NaCl)都是一樣鹹的嗎?
※為什麼車站裡周黑鴨比絕味人多很多?