城市規劃與管理中的數據分析和信息化建設

導讀:本文為北京清華同衡規劃設計研究院技術創新中心常務副主任李棟博士所作同名主題報告,通過近幾年的城市和數據工作,總結了數據在城市的應用及對未來發展的展望。

— 引子 —

大數據分析算不算是規劃信息化?

對這個問題的理解我們自己也在不斷變化中,最早在2013年剛開始組織北京城市實驗室BCL時,我們更偏向認為大數據分析不是規劃信息化。4、5年過去了,我發現在概念的認識上還是有很多誤區。

首先是對「規劃信息化」的理解太狹隘,過去的概念僅只是給規劃管理部門做一些成果管理或展示平台;其次數據分析其實是密切依賴於各類信息化工作的,二者密切關聯、相輔相成。這也是貫穿我近幾年圍繞城市和數據工作的最大反思。

來回顧當下數據發展的幾個大趨勢。

首先,全社會數據可用性極大增加。當前全球超30億人、約170億設備聯網在線,這些設備無時無刻不在產生數據。據統計,人類從直立行走到2003年所創造數據量總計5艾位元組,到2007年短短几年間數據量已超了300艾位元組;而到了2015年,全球網路流量接連翻番,數據量達到接近1000艾位元組;預測到2025年,全球數據總量將增長至現在的200倍到170,000艾位元組。可以說展望未來,大數據時代其實還沒有真正來臨,數據發展將呈現更加富集的趨勢。

其次,計算能力和演算法挖掘手段全面提升。計算能力得到飛速強化,強大的計算機通過網路連接,大量數據的並行處理成為可能,硬體方面也有很大的提升。現在的手機計算能力已經遠遠超過了早期的電腦,而且所使用的演算法獲得了全面的更新。十餘年機器學習發展基礎上,可以將這些龐大的數據和算力用於演算法的訓練,開發新規則來執行日益複雜的任務。以深度學習為代表的新手段得到持續優化,啟發新服務,刺激了對AI領域各方面的投資和研究。數據、設備、演算法幾個方面快速的發展,終將整個人類社會信息化的趨勢逐漸推向一個又一個高潮。

1、信息化的兩種場景

數據分析只是廣義信息化的一個環節,我們可以簡單做下分類。

? 一類是流程信息化(狹義信息化),指在既有機制下對業務的信息化改造,如政府委辦局的辦公OA等,流程和機制是預先規定好的。

? 另一類是決策智能化(廣義信息化),比如說我們要對城市發展的信息化做整合,而城市管理的規則和機制是開放的、不斷發展和變化的,我們的挑戰是如何運用信息化的手段處理這種挑戰。利用信息化對開放系統進行綜合決策,需要採集整理決策所需信息、設計多種決策方案、對方案開展模擬與預評估、對方案進行比選優化,對方案實施開展周期性監控、方案實施後評估等等,這是一個值得開展長期探索的方向,也是數據應用高附加值所在之處。

流程信息化,規則相對清晰、條件相對封閉、目標相對明確;而決策智能化規則相對模糊、條件相對開放、目標不夠明確,依賴更多、更複雜、非標準化信息輸入作為基礎。當面對決策智能化的時候,作為規劃師會往往會感到信息焦慮以及對工具的渴求,會懷疑自己是不是遺漏了什麼關鍵信息、從而對項目造成一些決定性影響,這是所有諮詢者、決策者共同面對的一個很大挑戰。

以規劃編製為例,即使是同一個地區,即使是遵循相同的規劃編製技術要求等規則,但由於每一次規劃編製的背景不同、規劃目標和實施手段也大相徑庭,因此對規劃內容本身(即待決策的方案)的評判標準也會存在很大的差異,更毋論如何對規劃方案進行優化和持續改進了。

如果從一個更大的、數據的視角來看待這個問題,流程信息化指利用自有數據解決自己的問題,比如財務報銷自動化等,而決策智能化則意味著要綜合使用自有數據和他類數據(alternative data),一起來解決自己的問題。

他類數據是指全社會其他部門數字化、信息化之後的積累,例如原本用於運營商計費和網優的手機信令數據,原本用於公交系統計費的市政一卡通刷卡數據,原本用於網站和APP經營的移動互聯網流量內容數據等等。我們現在之所以能夠在城市規劃中利用這些大數據,其實都要感謝早年其他部門所做的信息化基礎工作,雖然這些數據出現的動機並非是服務規劃師。推廣而言,所以若想解決城市這類開放系統的決策智能化問題,就需要全社會每個部門都把自己的信息化工作做好。

2、建立基礎「認知閉環」

規劃師扮演的是決策諮詢的角色,為決策者出謀劃策。因此,我們自己首先要建立一個邏輯閉環,按照了解、認識、見解、行動的順序。一般規劃師往往更關注感知、認知與決策這三個環節,但對於「行動」,或者說「實施」,則是規劃或者諮詢業者不太擅長的。規劃信息化的工作其實在另一個層面就是在做「行動」或「實施」,在不斷地修補、完善信息化系統。所以我也特別希望規劃從業者能夠再多走一步,將分析出來的好方案親手實現出來,建立起完整的數據思維閉環。

數據思維體現為對數據應用的工作流程(workflow)。

? 一是感知:數據的清洗收集,對現實了解得更精細;

? 二是測度:數據的分析評價,對狀況判斷得更合理;

? 三是挖掘:數據的綜合解讀,對原因理解得更深入;

1、數據感知:對現實的精細了解

用精細化的數據感知來滿足規劃師對於信息渴求的狀態。例如,去年做朝陽區人口統計時,數據分析的目的不僅想了解朝陽區的總人口規模,還想知道人口分布的具體位置、根據每個位置人口活動的24小時規律進行分類等等。

再進一步細化,比如了解CBD片區每個小建築裡面大致人口分布的多少,工作日與非工作日的變化。甚至包括對每一個網格,都想去了解人口構成的結構與信息等等。

多源數據耦合、交叉檢驗。當數據源不同時需要做一些檢驗,例如對一個地區的移動信令數據、滴滴出行數據、互聯網定位數據做交叉對比,判斷出哪個數據相對更合理。

2、數據測度:分析與評價

通過設計評價指標體系來聯繫物理世界與信息世界。將信息空間和物理空間聯繫起來就是信息—物理系統(Cyber-Physical System),二者通過指標體系相互反饋、調控。

通過演算法工具對狀況的合理判斷。數據評價包括許多內容,包括評價方式。單純把收集的數據落在圖上,很難直觀看出規律,需要模型、演算法、工具來幫助形成一定的結構化指標,從而可得到諸如聚類、分析等結論。例如,右圖中的方塊是共享自行車騎行軌跡的時空熱點,在相同時間空間,可以識別出哪裡是騎行行為相對比較聚集的區域,並進一步分析聚集的原因和影響等。

自行車騎行軌跡熱點時空分析

此外,還需要把非結構化數據(如街景圖片)變成可計算的結構化指標,這是大數據很關鍵的核心問題,需要藉助專門的工具或一些技術手段來實現。

街景圖像的計算機視覺分析

數據評價:對狀況的合理判斷。在充分感知數據、分析評價數據之後,就加入結論判斷環節了。例如我們可以根據騎行軌跡、街道狀況等要素,對騎行環境做出綜合評判。將結構化與非結構化數據疊合後,形成關鍵指標,根據問題和目標進行打分,最後得出好中差的觀點。

基於街景圖像數據的道路環節評價

圍繞需求設計多源數據的關鍵評價指標體系

評價指標結果:某時段騎行熱度空間分布

評價指標結果:某道路騎行熱度時間曲線

疊合分析的應用示例。比如,在對北京危險品運輸風險的大數據分析工作中,通過將危險品車輛GPS和同一時段人口分布進行重疊,識別出重疊率高的危險路段。左邊是進城的路段中重合較高的部分、右邊是危險品有大量聚集並停留較長時間的區域,把這些路段與片區識別出來,可以較好地預防一些危險品的泄露、爆炸等事故,避免不必要的生命財產損失。

危險品車輛出入城時段高重疊區

危險品車集中地

在設施評估案例里,我們對朝陽區32個2、3級醫院開展了就診人群分析,用醫院的到訪人口來源與分布情況,觀測京內京外比重,看哪些醫院是受外地人歡迎。

千人床位指標推算的理論覆蓋範圍

手機數據表示的實際覆蓋範圍

傳統醫院的配給指標是以一個區域的千人床位數來確定的,那我們可以根據這個指標反推出一個醫院的理論覆蓋範圍,如左上圖;但用人流數據可以更直觀的看到一個醫院的實際覆蓋範圍,如上圖。

通過對比,我們可以得到一些初步結論:一是4環以外的人口聚集區缺乏醫療設施的覆蓋;二是醫院的就診來源主要但不限於醫院周邊;三是某些外圍的衛生設施如地壇醫院存在覆蓋範圍重疊浪費的情況。

結合人口的本外地屬性,可以看到,中國醫學院腫瘤醫院的外地患者最多,佔到了44%,而其他的醫院則逐次下降。

3、數據挖掘:現象背後的機制和規律

除通過數據分析了解現象本身,繼續探索現象背後發生的原因規律及內在機制,在大量評價指標中找出隱藏的規律,簡單的方式如線性回歸,對於城市這樣非線性的複雜系統,最基礎但有效的包括隨機森林等。

以騎行行為挖掘為例,隨機森林模型展示了影響騎行軌跡分布權重較大的因素,主要包括道路長度、功能興趣點POI 總數、道路適宜度水平、公交車站300 米覆蓋路段長等。

以上海城市人口結構挖掘為例,隨機森林模型所示,影響上海年輕人分布權重較大的因素主要包括外地人口比重、最近軌道站點距離等。

主要影響因素及其權重

最後,將利用模擬、模擬為主要手段,反向使用前述數據挖掘得到的結果,應用所獲得的規律。通過改變某些指標(對應城市規劃或管理措施),使得決策樹的走向發生變化,也即開展了一次政策預演,反覆試算,使得我們可以基於隱含的規律對城市發展進行大量的沙箱模擬,尋求政策工具的最佳組合。

因此,自然而然地會觀察到,圍繞數據流開展的這些工作,無論是處理非結構化數據還是剖析非線性關係時,我們都在嚴重的依賴演算法作為工具。在數據時代,演算法的價值怎麼重視都不為過。

全社會廣義信息化需求將越來越旺盛。如果把上述數據流過程拓展到整個社會來觀察,會發現他們是相輔相成的,不同行業之間需要互相依賴彼此對數據的感知、測度、挖掘,最終實現整個社會的信息化和智能化。

3、城市規劃與運行管理信息化

1、建設信息化系統

建設信息化系統體現為解決問題的創造性、實踐性策略,主要強調三個原則:

? 一是以人為本:同理用戶感觸、貼近用戶需求;

? 二是模糊推進:在知識和能力的範圍上保留足夠彈性、充分嘗試;

? 三是原型迭代:由粗略簡易的原型開始設計和實施,快速持續地進行修正;

在此分享案例的委託方是呼和浩特市新城區社區辦,建設內容是呼市新城區居家養老服務體系,涵蓋了政策法規、運作機制、引導監督機制、居家養老智慧管理平台等內容,以老年人需求為導向,社會服務力量整合,政府監管體系為目標,提供多元化、專業化、高品質的養老服務。

2、信息化系統實施

在空間環境整治規劃方面,《文化產業區區域行動規劃》提出CIQ內部的交通網路以步行道為主,保留和尊重原有肌理。同時,在原有基礎上規划了兩條東北—西南走向和一條東西走向的主要道路,對路面進行拓寬和整修。CIQ的對外交通聯繫以方便快捷的公交系統為主。

首先是需求分析。信息技術為養老精細化管理與精準服務提供新的方法和手段,主要用戶面向政府、老人、服務單位。

其次是定位與策略。我們認為居家養老智慧管理平台應該實現連通政府各級部門、老人、服務單位等對象的基本能力,促使信息互通互聯、養老業務全過程留痕、線上線下有效互動,實現老年事務的聯動管理、服務單位的監督監管、智慧養老決策支持等核心功能。

實施中利用軟硬體進行整合支撐。以養老卡為核心載體,利用手機APP、信息查詢一體機、智能穿戴設備等各類線上線下手段,採集老人基本信息、為老交易、健康狀況等各類數據,聯動衛計、民政等多個政府部門的業務數據,實現老人數據的全面覆蓋和聯動更新,在此基礎上合理實施技術架構,通過統一的底層資料庫支撐上層各類應用系統,採用模塊化的方式,後期可按照需求進行功能的增減調整。

上線運行、迭代維護。信息系統建設交付其實只是一個開始,更加重要的是提供長期的線上線下運維服務。目前平台初步實現了國家及各地的相關公開數據的整合,為新城區居家養老服務體系建設提供參考;融合本地老年人各類健康數據,全方位實時掌握老人健康信息;實現服務商信息的統計、審核、以及監管,對服務商相關數據收集、分析;為政府部門對養老事業相關決策提供科學、客觀的數據支撐。

社區指揮中心系統運行現場情況

4、展望智能化的遠景

我們重新把視角聚焦在城市規劃與管理上,未來遠景目標是在規劃師個體認知閉環的基礎上,完善城市發展相關業務智能化的閉環。

以決策諮詢為視角,有兩個關鍵支撐點:

? 一方面是必須整合多源大數據,數據可獲得性、維度、屬性決定了數據分析、信息化工作的基本面;

? 另一方面是必須熟悉業務領域需求,應該說數據分析和挖掘的視角是多樣化的,而城市問題又是如此複雜,需要識別並緊密圍繞領域內的關鍵需求來工作,科學設計指標體系,指導實施措施,在有限的數據分析結論中催生最大化的現實價值。

最後一點個人感受,數據思維與實施思維並非是割裂的,更好的做法是把二者有機的結合在一起。數據思維可能比較「陽春白雪」,進行大數據分析,做各種酷炫的展示,屬於腦力勞動;但其實真正發揮作用的也許是一些不起眼的信息化項目、實幹項目,姑且稱之為「下里巴人」。我正試圖在二者之間建立一種能夠相互促進的正向反饋模式,未來肯定還需要大量的探索和完善。

文中配圖由李棟提供,頭圖來源於網路


推薦閱讀:

又到求職黃金季,這些技能助你一臂之力【阿里直聘優先錄取】
中華財寶:珠寶行業在大數據時代該如何前行?
滴滴拼車路徑的優化
知識分享 | 不超3分鐘看懂「PHM」!
大數據時代普通人也要懂得,否則錢掉頭上只知道痛而不知道撿

TAG:城市規劃 | 大數據 | 信息化 |