[原創]政務大數據的邏輯模型
政務大數據的邏輯模型
宇塵埃 2018-2-11於京
在《政務大數據的概念模型》一文中,重點討論了政務大數據的業務實體關係,即其外模式(用戶視圖)。政務大數據的邏輯模型(模式)是基於其概念模型,對其邏輯結構進行數據建模,它重在說明數據之間的邏輯關係。自底向上而言,政務大數據的邏輯模型包括:元數據、主數據和主題數據三個核心部件,數據存儲、數據計算和數據服務三個重要層面,數據採集、數據運營和數據管理三個基礎體系。
先看政務大數據的三個核心部件。
作為「數據的數據」(data about data),政務元數據服務於政務大數據的採集、標準化、規範化和數據交換。提到元數據,不得不提OMG(Object Management Group)的 CWM(Common Warehouse Metamodel ),即通用數據倉庫元模型。CWM定義了元數據的規範、標準,覆蓋了關係型、非關係型和多維數據,以及在數據倉庫環境之下的其他數據對象。作為基於傳統數據倉庫理論的元數據定義,在大數據的應用情景下依然適用。在大數據的應用場景下,元數據也依然是重要的標準化組成部件。按照元數據的用途,可分為技術元數據(用於開發和日常管理如控制)和業務元數據(關鍵業務價值、業務上下文)。前者是運作保障,後者是實質內容。元數據尤其是技術元數據的標準化、規範化程度(數據標準、映射關係和規則)決定了數據的質量,元數據尤其是業務元數據的規劃設計水平決定了數據的價值。就政務大數據而言,其技術元數據支撐著政務應用體系的開發規範和控制模型,業務元數據支撐著政務大數據的核心價值實現(服務於公民、企業、外國人和其他社會組織)。依據《政務信息資源目錄體系 第3部分:核心元數據》標準,核心元數據內容有20項(其中,必選項有6項)。如下圖所示(加*的為必選項):
以政務的核心技術元數據為例,「政務部門」的屬性數據應該有「標識ID、名稱、描述」以及聯繫方式等信息;「部門服務」的屬性數據應該有「服務ID、名稱、描述、語言、訪問地址、綁定結構」以及約束限制等信息;「服務模型」的屬性數據應該有「標識、名稱、描述、描述語言、描述文檔」等信息。依據《政務信息資源共享管理暫行辦法》(國發〔2016〕51號),政務信息資源目錄分為基礎信息資源、主題信息資源和部門信息資源三大類,其主要內容就是政務大數據的元數據。
政務大數據的主數據是服務於政務信息集成與共享的全局性政務信息資源數據,其核心價值在於在全局範圍內具有較高的可共享性。元數據強調的是規則、規範和標準,說明數據的組成結構;主數據是被實例化的,是被反覆引用的關鍵業務數據,強調的是政務數據集成共享後的核心業務價值。同時,主數據是基於元數據而有效發揮作用的,是基於政務資源目錄的政務信息共享交換平台所共享交換的主要內容。如政府權責清單(權力清單、責任清單)、行政許可事項,以及政務信息資源目錄所具體指向的、服務於信息集成和共享的相應信息資源就是典型的政務大數據主數據。
政務大數據的主題數據是對政務信息資源進行戰略規劃後的產出物,體現的是數據視角下的政務業務融合。主題數據和主數據的聯繫非常緊密,在部分場景(如面向信息共享服務)下是有交叉的。兩者的主要區別在於主數據是應用集成在數據層面的體現,主題數據是信息集成在數據層面的體現。因此,主題數據更加強調全局戰略規劃。做好主題數據的規劃,將對主數據的建立和治理提供重要參照。政務大數據的主題數據是圍繞政府職能的變革而變革、發展而發展的。政務大數據的主題資料庫,將是其提供數據價值服務的重要載體和資源。如公安大數據、農業大數據、工業大數據等都可以視為典型的政務大數據的行業主題資料庫。當然,這種行業主題的範圍過於寬泛,需要逐級細化到第三層才能更好地形成政務大數據的元服務。以公安大數據為例,其第二層假設為治安管理主題,其第三層繼續分解出「社區網格化聯動」,就可以對接具體的政務數據服務了。
除了元數據、主數據和主題數據,政務大數據的數據元(基本數據單元)的規劃、治理對提高電子政務系統之間的互操作性、協同性也非常重要。在《GBT 19488.2-2008 電子政務數據元 第2部分:公共數據元目錄》中,對電子政務的公共數據元進行了標準化。政務大數據的數據元是政務大數據主題資料庫的重要邏輯構件。多個數據元可以組合在一起形成複合的政務數據元,從而提供更綜合的政務數據服務。
在探討完畢政務大數據的三個核心部件(元數據、主數據、主題數據)之後,我們來看其數據存儲、計算和服務三個重要層面,以及採集、運營和管理三個基礎體系。政務大數據的主題數據為其元服務建立了重要基礎,在物理上需要構建其存儲、計算和服務三層模式。政務大數據的元數據規劃、治理好了,其存儲模式也就建立了;計算層的計算能力有賴於主數據的規劃、治理;服務層的服務能力依託於主題數據的規劃、治理。鑒於「漫談政務大數據」系列文章計劃專門有一篇關於政務大數據物理模型的,因此本文不對其數據存儲、計算和服務三層模式做具體展開。在政務大數據的邏輯模型中,還有數據採集、運營和管理這三個基礎體系。簡言之,基於元數據進行數據採集,基於主數據進行數據治理,基於主題數據提供數據服務,政務大數據的運營和管理就是進行數據治理和提供數據服務的過程。這三個基礎體系將在《政務大數據的價值鏈》、《政務大數據的運營》等後續文章中繼續討論。
綜上,政務大數據的核心部件是其元數據、主數據和主題數據,在物理上分為數據存儲、計算和服務,在體系上又涵蓋數據採集、運營和管理。
原文首發:
政務大數據的邏輯模型
推薦閱讀:
※產品經理:一張表格理思路,行為數據打輔助
※扯個關於大數據的淡
※大數據時代普通人也要懂得,否則錢掉頭上只知道痛而不知道撿
※歡迎收藏丨6個免費數據源網站
※阿里巴巴大數據之路