[原創]政務大數據的概念模型
宇塵埃 2018-1-30於京
本文是漫談政務大數據系列文章序(《政務大數據的本質》)之外的第三篇,以數據的視角對政務大數據進行概念模型分析。政務大數據的本質是政務,從數據建模的視角來看,它同樣存在廣義上的概念模型(Who)、邏輯模型(What)和物理模型(How)。以軟體工程來做對應說明,數據的概念模型對應於軟體系統之需求、邏輯模型對應於軟體系統之設計、物理模型對應於軟體系統之實現。要梳理清楚政務大數據的脈絡,需要先刻畫好其概念模型。
在《政務大數據的全景圖》一文中,從三方面(A.價值主客體 B.生命周期 C.過程與流程)闡述了政務大數據。其中,政務大數據的價值主客體通過其提供和使用過程有機地聯繫起來。在《政務大數據的上下文範圍》一文中指出:政務大數據可以概括為在政府職能行使過程中所產生和利用的「業務作業數據」、「行政監管數據」、「規範治理數據」、「決策分析數據」和「綜合服務數據」五大類數據。由此可見,政務大數據的概念模型一方面要對政務大數據提供和使用全過程、全周期的業務實體關係進行刻畫,另一方面要對政府職能行使過程中所產生和利用的五大類數據進行基於業務主題的數據建模。
政務大數據提供和使用全過程、全周期的業務實體關係,可以從其五個主客體:管理者、運營者、提供者、所有者和使用者來展開。
以管理者、提供者和使用者為例,管理者對政務大數據的核心職能在於數據的監管和治理,其監管和治理的範圍還會涵蓋所有者和運營者。對於政務大數據的提供者來說,數據服務是基礎,價值創新是核心。在政務大數據的五個主客體中,使用者是整個鏈條里數據價值最終落地的一環,從數據獲取、加工、建模和分析四個基本動作中來體現其價值。
此外,政務大數據所有者的核心問題在於權屬,確權、鑒權和安全使用是工作重點。市面上很多觀點在大提特提數據的資產化,在拿數據價值和土地價值做類比。無可厚非的是,這些提法和類比有一定的意義。但是,這種提法和類比都是有顯著的局限性的。首先說這個數據的資產化,在大家眼冒紅光盯著數據即資產的時候,必須要明確的是這個資產歸誰所有、又是誰具有收益權,如果發生侵權怎麼辦。合理權衡公民、法人和政府各個角色間的權責利顯得至關重要。當前,政務大數據的主旋律是共享和開放,根本原因在於數據價值沒有被充分挖掘和利用好。一旦過渡到共享和開放成為常態的發展階段,數據產權保護將成為工作重心。因此,數據產權立法必須有一定的前瞻性,既要充分快速發展,又要避免混沌時期太多的渾水摸魚擾亂秩序。同時,數據產權保護和數據合規使用的技術體系和框架規範丞待完善健全,在這一方面的深入技術研究也將會大有可為。至於政務大數據運營者這個角色的確立也需要大智慧,是「政府主導、各方參與」?,還是「充分發揮市場競爭、加強政府監管」?這個問題也需要實踐來檢驗。毋庸置疑的是高速公路、鐵路交通、郵政電信、銀行金融等都在逐漸地從國有獨營走向市場化和多元化。政務大數據的運營能否實現跨越式發展一步到位,也是很值得期待的。
在政府職能行使過程中,產生和利用的五大類數據分為「業務作業數據」、「行政監管數據」、「規範治理數據」、「決策分析數據」和「綜合服務數據」。其中,業務作業、行政監管和規範治理是基礎,決策分析和綜合服務是目的。各級政府的履職最終目的是通過社會治理服務於民,行政和監管是手段,規範治理是方法。其中,每類數據又都可以按照公民、企業、外國人和社會組織四種被服務的對象來分別展開描述。鑒於這個話題比較大,本文只是在政務大數據的概念模型層面上做概括性描述,計劃今後單獨列出相應專題具體來展開。
原文首發:
政務大數據的概念模型推薦閱讀:
※RDD論文翻譯:基於內存的集群計算容錯抽象
※無監督學習,你何德何能?
※獨家 | 一文帶你上手卷積神經網路實戰(附數據集&學習資料)
※G20遐想:馬雲、李彥宏、孫丕恕等大咖們的數據觀
※大數據計數原理1+0=1這你都不會算(二)No.50