業務系統的數據資產管理為什麼這麼難?

業務系統的數據資產管理為什麼這麼難?

文 | 傅一平

源 | 公眾號「與數據同行」

如果你做過BI或大數據,一定會接觸數據資產管理的一些概念,比如元數據,數據字典,血統分析等等,但你會發現,要做好大數據平台的數據資產管理並不容易,比如數據字典的維護,為什麼?

我們可以有一堆的理由,比如戰略問題、業務問題、流程問題、機制問題、平台問題,人力資源問題等等,但假如這些問題都解決了,是否意味著你的數據字典就可用了呢?

也不是。

為什麼呢?

因為大數據平台的數據來自於各個外部業務系統(上游系統),其數據字典的質量是受到上游系統約束的,而一般業務系統的數據資產變更規範性是比較差的,比如沒有專門的數據管理系統來進行管理,究其原因主要有以下三點:

一是管理難度高,很多企業業務系統會比較多,各類系統的開發流程很多還不一樣,比如來自於各個合作夥伴,要統一數據資產管理的標準非常困難,流程的複雜性導致統一數據管理平台的建設門檻也很高,商用的數據管理平台(比如元數據管理)大多是無法適應這種複雜的場景的,而大數據平台天然的集約型使得數據管理更可能成功。

二是驅動力不夠,業務系統在開始建設的時候,關注的是功能的快速實現,很少有人能預見到諸如數據資產管理這種非功能性的需求,而要對已經建成的業務系統再重新梳理數據資產進行管理,則顯得困難重重。

三是效益不明顯,雖然大家都開始認識到數據資產管理的重要性,但重要而不緊急的事情總是很難提上日程,短期內數據資產管理的規範性跟開發的靈活性一定程度上還是衝突的,似乎從線下文檔或開發人員口中獲取信息也不是難事,但這個隱性的管理成本其實很高,等到系統要重構或大版本升級的時候會發現系統變得好陌生。

那麼,業務系統的數據資產要不要系統化的自動管理呢?

答案是不一定,這個依賴當前業務系統的規模和成熟度,一個判定標準是當企業的IT要考慮中台戰略的時候,也許數據資產管理也要提上日程,因為中台意味著沉澱和復用,而數據知識非常需要沉澱。

對於擁有大數據的企業來講,高效使用數據的一個前提是理解數據資產的準確含義,比如背景、命名、釋義及枚舉值等等,而業務系統是數據產生的源頭,理應承擔起數據資產管理的重任,比如確保數據資產的質量,數據資產變更能自動提醒等等,其不僅要考慮自身利益,更應站在企業的全局角度看待這個問題,這也符合第一性原理,下游系統的數據資產管理管的再好,巧婦也難為無米之炊,上游垃圾進,下游也是垃圾出。

那麼,業務系統的數據資產管理要怎麼做呢?

除了傳統的元數據管理那套理論,這裡再給出三點建議:

首先,在策略層面,需要業務系統對於數據資產管理能有足夠的重視,這是第一要務,大家會問投入那麼大的代價去搞這個體系到底有沒有價值?

的確在前期看不清的情況下,沒必要畢其功於一役,因此需要找到好的場景切入點,比如存量中找個核心的系統進行試點,也可以只針對新增系統進行嘗試。

其次,在方法層面,不建議採取後向的方式,比如事後補錄數據字典,這種方式往往導致與生產系統的嚴重不一致,最終積重難返,要從數據資產產生的源頭進行管控,即需要從資料庫接入、開發到上線的整個流程進行管控,對於流程中涉及的任何數據資產管理的操作進行規範,比如資料庫新建、建表,變更等等。

數據資產管理需要跟企業的整個數據產生流程無縫銜接,比如不按照規範進行數據資產錄入變更,業務系統就不能上線,要有這種壯志斷腕的決心,否則就不建議做。

下面筆者列出了業務系統數據資產管理流程的一個示意,這裡涉及四個關鍵角色:

1、資產接入責任方:負責及時對數據源進行管理,比如新增資料庫和用戶,並將其接入到數據資產管理平台

2、資產開發責任方:依託數據資產管理平台按照資產管理的規範進行建表等操作,確保數據資產的質量,比如對錶,欄位解釋清楚含義

3、資產維護責任方:負責資產上線發布管理,對數據資產管理平台與生產系統的資產進行比對,督促資產開發責任方進行資產修復

4、資產總體管理責任人方:負責整個企業數據資產的管理,包括數據資產管理平台的建設,數據資產管理規範的建立,數據資產的跟蹤及質量通報、跨專業協調解決等。

最後,在系統層面,要打破專業、上下游系統的邊界,構建一個企業級的數據資產管理平台,實現對各類業務系統、大數據平台及相關BI系統的數據資產的統一管理,其不僅要包括傳統的元數據管理等功能,更要包括開發管理、流程管理等眾多功能,從而適應企業特定的數據資產管理規範要求,一般來講,不要奢望讓企業的業務流程去適應系統,數據資產管理系統一定要與時俱進。

業務系統的數據資產管理能力一旦形成,下游系統的數據資產管理效率就能自然提升,無論是資產的自動發現,比對或是稽核,下游系統不再需要靠大量的線下確認工作去疲於應付上游系統的變更,原來的被動資產管理模式將向著更主動的方向演進。


推薦閱讀:

SQL 常用命令及練習--之一
翁氏之名人八字資料庫148例
TiDB 在 Mobikok 廣告系統中的應用和實踐
傳統關係資料庫高可用的缺失
八字資料庫---丁火日元

TAG:資料庫 | 大數據 | 數據分析 |