上海300億條計程車數據里的秘密
原文載自微信公眾號:城市數據研究院(SHDATA)
上海強生計程車公司的計程車每隔10秒鐘會自動向總部的伺服器發送一條數據,記錄自己所在的經緯度、車速、車內是否有人、行駛方向等信息。2015年上海政府公開了4月一整月的計程車數據,足足有300多億條,占空間300多G。這些數據被導入了我們的Hadoop平台,以便後續研究。以下是我們初步探究發現的秘密。- 秘密1 - 上海的交通如煙花般絢爛
http://mp.weixin.qq.com/s?__biz=MzIwOTMyNzk4Nw==&mid=2247483853&idx=1&sn=a5e2eb81cd8ef0156b2312579b66e7a7&scene=2&srcid=0808PSPAlgDkIQepfrSBkxcL&from=timeline&isappinstalled=0#wechat_redirect
上圖是根據這300億條數據繪製出的上海各時段各點的車流量示意圖,很顯然越紅越亮代表那個時段的車流量越多,越暗越黑代表那個時段的車流量越少。可以看到,上海的道路縱橫交錯,車流量生生不息。市中心理所當然是車流量最集中處,特別是南北高架和延安路高架,哪怕是夜深人靜的時候,依然有許多計程車在上面飛馳,可見上海果真是一個不夜城。
右下方通往浦東國際機場、非常顯眼的是華夏高架路,它也是一條非常繁忙的道路,連接著中國通向世界各地的窗口。
- 秘密2 - 上海8點13分最堵
上圖是根據數據繪製的上海一天中每分鐘的車輛平均速度,工作日的六點左右有一個速度高峰,估計那是計程車司機早上出門接人的時候。而7點到9點、17點到20點,是早晚上下班高峰,有兩個明顯的速度低谷。早高峰車速的最低點發生在8:13,平均車速29KM/H,晚高峰車速的最低點發生在17:47,平均車速30KM/H,這兩個時間應該就是上海最堵的時刻了吧。- 秘密3 - 周六路上並不空
另外,周六的平均車速與工作日並無顯著差異,而且周六一天內各時段也沒有車速低谷(早晚交通高峰)出現,說明周六還是有不少人在街上活動,是不是周六大家都喜歡出門聚會、逛街呢?還是有些事只有周六才有空去辦?數據表明,一周中只有周日的車速比較空,路上比較空,看來對於上海這座城來說,只有周日才是真正的休息日啊。
- 秘密4 - 凌晨在崗司機多在車內休息
數據中有個好玩的現象,白天的時候不管什麼時段都有30%左右的計程車車裡有人(哪怕僅有司機一個人)、且為「營運」狀態,但車速是零。這可能是因為不管什麼時候總有30%的車輛在等紅燈,畢竟每個十字路口總是一半車輛通行的同時,另一半車輛必須停下等待。晚上23點以後,這個佔比會大幅升高,在凌晨4:08的時候,達到峰值95%。也就是說,凌晨會有很多司機坐在車內,把車頂的燈調成「營運」狀態,然後停靠在某個地方休息。據了解,在車內休息的原因是司機想等待附近想乘車的乘客前來敲窗詢問。而把頂燈調成「營運」狀態是因為司機不想半夜被電話調車中心打擾:電話調車中心會聯繫「待運」車輛,司機並不想半夜被調度到老遠的地方接一個不知道要去哪裡的客人。
- 秘密5 - 司機凌晨多停靠在寶山區
那麼計程車司機會把車停靠在哪裡呢?上圖是根據數據繪製的計程車夜間停靠示意圖,越紅越亮的點說明停靠的計程車越多。可以看到,雖然到處都會有計程車停靠,但寶山區是半夜計程車停靠的熱點區域。據業內人士稱,很多計程車司機就居住在寶山的顧村、淞南一帶,也許他們上夜班的時候就喜歡在家附近躺在車裡休息。以上只是對計程車數據的初步探索,後續還會和房地產數據、地鐵數據結合分析,挖掘上海這座城市更多的秘密。如果你對於計程車數據有不同的看法,或者知道一些內部消息,歡迎留言與眾讀者分享!
- 本期責任人 -
撰稿+數據可視化:沈雨瀟
大數據平台支持:陳超視覺設計方案支持:張岑
推薦閱讀:
※關於杭州,你印象最深的是什麼?
※上海哪些地方落後於北京?
※北京為什麼不能建更多高密度的高樓?
※一個城市最有人情味的地方是哪裡?
※常州有哪些值得一去的餐館,館子里一定要嘗試的菜式有哪些?