數據下的城市擁堵秘密:「抄小路」也是一門智慧

文/張忠元、成慧敏

城市高速發展帶來的交通擁堵問題一直是帝、魔兩都的「心頭病」,然而,帝都並非每條路都堵。本文數據俠創新性利?計程車運營軌跡數據來分析?路利?情況,得出北京市存在支路利用率低的問題,並為城市研究提供新思路。

本文轉自公眾號市政廳(ID:shi-zheng-ting)

隨著大數據時代到來,中國著?建設交通信息化?程,旨在將各類交通?數據應?於城市管理,充分利?各類交通數據資源。作為城市交通的必不可少的?部分,計程車以GPS數據記錄了司機在受到路?限制條件下載客的時空軌跡[1]。

計程車司機有豐富的經驗,他們往往會根據經驗選擇最優的路線。計程車司機出行主要依靠4種道路:城市道路分為快速路、主?路、次?路和?路[2-3]。

長期以來,在道路?規劃中,人們往往把?光聚集在快速路以及?路建設上,?忽略了?路?的規劃建設,導致城市路?銜接不暢。本應為?們帶來較?便利性的?路體系變成了各類「斷頭路」、「瓶頸路」和「錯位路」。

?2016年2?6?中共中央國務院發布《關於進一步加強城市規劃建設管理工作的若干意見》後,?們才開始?度重視該問題。但是,?們關於上述意見的討論還僅限於定性研究,據我們所知,?前還沒有?從定量的層?提供建議。

在此,我們基於收集到的北京市計程車運營數據和紐約計程車運營數據,試圖量化回答兩個問題:

1. 北京市是否存在?路利?率低的問題?

2. 如果存在,那麼哪些地??路利?率低的情況最嚴重?

一、數據與方法

我們收集到2012年11?北京市和紐約市的計程車運營軌跡數據,其中包括5134909條北京市計程車和紐約市11797410條黃色計程車的運營記錄。圖1為北京和紐約的計程車位置分布圖,顏色越亮表示車流量越大。

(圖片說明:a 北京市計程車位置分布圖,b 紐約市計程車位置分布圖)

為研究支路利用率的問題,我們首先構造出繞路比指標:R=Dt/Dl

其中Dl指兩點之間的直線距離,Dt指兩者之間的行駛距離。

行駛距離為計程車的行車記錄儀記錄下來的距離,直線距離由我們通過計算上車坐標與下車坐標之間的球面距離而得。R值越大,說明行駛距離與直線距離之間的差異越大。R值和?路利?率緊密相關。如果城市?路利?率越?,即出行的直線距離和?駛距離的差別越?,R就越接近1。反之,如果城市?路利?率越低,R就越?。這樣的特徵在短距離的旅?中表現得尤為突出(有研究表明,短途出行時,計程車司機更傾向於選擇支路[4])。

二、北京與紐約的對比

北京市與紐約市都是以汽車和地鐵作為主要客運交通?具的特?型城市。2012年11?,兩市計程車運營直線距離和上車時間分布密度如圖2所示。

從運營距離看,兩市計程車的運營直線距離都集中在0到5000?,且都呈現右偏分布的特徵;從上車時間看,兩市計程車的運營時間都呈現出約三個波峰的分布特徵,且三個波峰出現的位置基本相同。因此,兩市計程車運營狀況具有?定可?性。

(圖片說明:上車時間(左圖)與直線距離(右圖)分布密度圖。左圖中的X軸表示時間,1表示凌晨1點,2表示凌晨2點,….,23表示晚上11點。)

整體對比

如表1所示,北京市R的平均數是1.582,紐約市R的平均數是1.477。我們使?t檢驗?法檢驗兩市的R是否具有顯著性的差異。結果顯?,北京市R顯著?於紐約市R,說明從總體看來,北京市?路利?率顯著低於紐約市?路利?率。

(圖表說明:不同城市的R值特徵。其中MN表示均值,MD表示中位數,STD表示標準差,Q1表示四分之一的中位數,Q3表示四分之三的中位數。)

按上車時間分組比較

我們對上車時間,按照1?時為組距,分組統計兩市計程車的R。我們對每?組R

都做了T檢驗。檢驗結果如圖3所示,?乎所有時段,北京市繞路?顯著?於紐約市繞路?,車流量較?的時段,兩市繞路?都較?,車流量較?的時段,兩市繞路?都較低,北京市繞路?的波動?紐約市繞路?更明顯。

按直線距離分組比較

我們對直線距離,按照500

?為組距,分組統計兩市計程車的R。本?對每?組R 都做了T檢驗。檢驗結果如圖3所示,直線距離?於6500

?時,北京市R值顯著?於紐約市的R值。值得注意的是,69.06% 的北京市計程車運營和87.64% 的紐約市計程車運營處於該範圍。

(圖片說明:繞路?按上車時間(左圖)和直線距離(右圖)分組?較;實線表?北京市, 虛線表?紐約市,紅?區塊表?北京市R值顯著?於紐約市R值,藍?表?紐約市R值顯著?於北京市R值,白色表示t檢驗結果不顯著。)

按時間距離交叉分組比較

最後,我們直線距離按500?為組距,對上車時間以1?時為組距進?了交叉分組,

對每組的結果進?了t

檢驗。檢驗結果如圖4所示,北京市繞路?顯著?於紐約市繞路?的區域呈現出明顯的集群特徵。在北京,小於5000米的短途出行時,繞路比顯著高於紐約,該特徵在白天尤為明顯。

綜上,我們得出結論:北京市的確存在支路利用率低的問題。

(圖片說明:繞路比按時間距離交叉分組比較。圖中X軸表示直線距離,縱軸表示上車時間。 紅色格子表示北京市R顯著高於紐約市,藍色格子表示紐約市R值顯著高於北京市,顏色越深,差異越大。白色表示t檢驗結果不顯著。)

以上分析顯?, 北京市確實存在?路利?率低的問題。

三、繞路比高的計程車,主要的上車點及下車點在哪?

那麼,到底北京哪些上車點,存在?路利?率低的問題? 同理,哪些下車點存在?路利?率低下的問題也是我們關?的。

時間特徵分析

車流量高峰期時,為避讓擁堵路段,有些計程車司機選擇其他路段,同時帶來一定副作用——繞路,從而降低R值衡量支路利用率的可信度。因此我們主要關心非高峰期時段的情況。我們將時間劃分為24 個?時,如圖5所?,不同時間段下R 值的分布呈現以下特徵:

(1)7-9 點為上班?峰時期: 該時段內R 值?的上車點分布較為分散。

(2)10-17 點?天??峰期: 該時段內R 值?的上車點主要集中在中關村和北京南站等區域。

(3)18-22 點為下班?峰期: 該時段內R 值?的上車點分布比較分散。

(4)23-6 點為夜間??峰期: 該時段內R 值?的上車點主要集中在軍事博物館和?望路區域附近。

(圖片說明:圖中紅??格表?繞路?較?的地點。按時間分組展?:a 圖表?7點到9點,b 圖表?10點到17點,c 圖表?18點到22點 ,d 圖表?23 點到凌晨6 點。)

空間特徵分析

我們將0到20000?的直線距離劃分為41 個區間,每個區間的長度均為500 ?。如圖6所?,不同距離段下R 值的分布呈現以下特徵:

(1)0-1000 ?短距離出?: 這段距離出?的計程車繞路?值最?,R 值?的上車點集中分布在五棵松、軍事博物館等區域。

(2)1000-5000 ?中短距離出?: 中短距離出?的R 值?短距離出?時低, 說明這段距離的繞路情況?短距離時有所緩和, 主要集中在北京南站、國家圖書館和王府井等區域。

(3)5000-10000米中長距離出?: 這段距離出?的計程車R 值?的上車點集中分布在北京南站、丰台科技園等區域。

(4)10000-20000米長距離出?: 這段距離出?的計程車R 值?的上車點集中分布在北京的郊區,北邊集中在西二旗,南邊集中在丰台科技園。

(圖片說明:圖中紅??格表?繞路?較?的地點。按直線距離分組展?:a 圖表?1000米以內,b 圖表?1000-5000米,c 圖表?5000-10000米 ,d 圖表示10000米以上)

綜上,我們得出以下結論: 北京市R值高的上車點主要集中在王府井、國家圖書館、北京南站、中關村、軍事博物館和和五棵松?帶。同理,我們也可以對下車點進行分析,北京市R值高的下車點主要集中在王府井、北京南站、軍事博物館、國家圖書館、五棵松和積水潭等區域。

哪些地方的支路利用率低?

目前為止,我們靜態分析了哪些上車點上車和哪些下車點下車會繞路較遠, 那麼繞路繞得?較遠的路程是從哪?上車和哪?下車的?

為解決這個問題,接下來以動態的視?,從兩??開展分析:

???,?R值的上車點主要集中在王府井、中關村、國家圖書館、北京南站、軍事博物館和和五棵松區域附近。從這些上車點出發的計程車,是去哪些地?下車會繞路繞遠呢?分析結果如圖7所示。

另???,?R值的下車點主要集中在王府井、北京南站、軍事博物館、國家圖書館、五棵松和積水潭等區域附近。到達這些下車點的計程車,都是從哪些地方出發導致繞路繞得遠呢?分析結果如圖8所示。

(圖片說明:固定上車點,找R值高的下車點。圖中紫?和綠??格表?固定的上車點, 其中綠??格表?從該點出發到達該點繞路比也高。紅色方格表示從綠色(或紫色)方格出發,且繞路?較?的車輛到達的終點。)

(圖片說明:固定下車點,找R值高的上車點。固定下車點,找R值高的上車點。圖中紫?和綠??格表?固定的下車點, 其中綠??格表?從該點出發到達該點繞路比也高。紅色方格表示到達綠色(或紫色)方格,且繞路?較?的車輛出發的上車點。)

當固定?R值的上車點時,我們發現,其對應的下車點都在上車點附近。應用同樣的思路,固定其下車點,我們也發現對應的上車點都是在下車點。這?結論和我們之前的分析?致,即?R值的記錄都是短途旅?,?短途旅?中更多依賴?路,因此,我們能夠找出?路利?率低的地?。

?R值的上車點和下車點重合的區域為王府井、北京南站、軍事博物館、國家圖書館、五棵松,說明這些區域的?路利?率低下的情況?較嚴重,在這些區域鄰近範圍內?駛都會繞路繞得遠。

結論與建議

我們創新性利?計程車運營軌跡數據來分析?路利?情況,不僅為城市研究提供新思路,得出的結論也具有很強的實際意義。我們通過?系列分析,得出北京市確實存在?路利?率低的問題,??路利?率最低的區域主要集中在王府井、北京南站、軍事博物館、國家圖書館、五棵松這些區域。

其實北京市存在很多?路,只是由於各種原因,?如沒有路標指?、?路與其他道路之間不連通等,導致?路利?率低下。建議管理者著重在這些區域加強?路規範化管理,包括對違規佔道售賣和停放的管理、對路?硬化和綠化的管理以及加強?路路標指引建設的管理等。

參考文獻:

[1]

H. Cai, X. Zhan, J. Zhu, X. Jia, A. S. Chiu, and M. Xu, Physica A:

Statistical Mechanics and its Applications 457, 590 (2016).

[2] S. A. Arhin, L. N. Williams, A. Ribbiso, and M. F. Anderson, Journal of Civil Engineering Research 5, 10 (2015).

[3] T. Toledo, H. Farah, S. Morik, and T. Lotan, Transportation research part F: tra_c psychology and behaviour 26, 180 (2014).

[4] 李恆鑫. 基於緊湊城市理念步?原則的街區尺度與道路模式研究.Master』s thesis, 南京?學, 2014

編輯 | 王旭晶: wangxujing@dtcj.com

題圖 | 站酷海洛

▍數據俠門派

本文數據俠張忠元,中央財經大學統計與數學學院教授。成慧敏,中央財經大學統計與數學學院博士生。

▍加入數據俠

「數據俠計劃」是由第一財經旗下DT財經發起的數據社群,包含數據俠專欄、數據俠實驗室系列活動和數據俠聯盟,旨在聚集大數據領域精英,共同挖掘數據價值。了解數據俠計劃詳情請回復「數據俠計劃」,投稿、合作請聯繫datahero@dtcj.com。

推薦閱讀:

TAG:城市規劃 | 道路擁堵 | 大數據分析 |