《數據架構》閱讀筆記(十二完結篇)複合式的數據架構
《數據架構——大數據、數據倉庫以及Data Vault》,作者W.H. Inmon,DanielLinstedt,譯者唐富年,人民郵電出版社,2017年。
筆記中有些內容直接引用原書。
================================================================
複合數據架構有以下幾個值得關注的特徵。
1. 數據的時效性。一般來說,數據越新就會離交互環境越近,數據越舊則越可能被遷移到歸檔環境。
2. 交互環境的關鍵在於應用程序的執行。數據倉庫/Data Vault環境的本質就在於數據的集成。
3. 大數據組件可以分成兩個主要部分,即分析型大數據部分和歸檔型大數據部分。
4. 元數據可以橫跨不同的環境而不受限制。真正企業元數據在任何情況下都是跨數據的。元數據並不考慮數據的不同物理形態或者其他邊界。
5. 在整個複合架構中存在不同層面的元數據。
6. 該複合架構中描述了企業中詳細的、基礎性的數據(也就是記錄系統中的數據)。其他一些數據(包括匯總數據和合計數據)雖然存在於企業之中,但是在該複合架構中並未反映。(該複合架構中也並沒有反映數據集市。)
7. 在該複合架構中,數據類型有著根本性區別。非結構化數據(也就是非重複型數據)並不直接與基於事務處理的數據(也就是重複型數據)相混合。
BrianZhang:《數據架構》閱讀筆記(一)企業數據BrianZhang:《數據架構》閱讀筆記(二)大數據BrianZhang:《數據架構》閱讀筆記(三)數據倉庫BrianZhang:《數據架構》閱讀筆記(四)Data VaultBrianZhang:《數據架構》閱讀筆記(五)作業環境BrianZhang:《數據架構》閱讀筆記(六)數據架構BrianZhang:《數據架構》閱讀筆記(七)重複型分析BrianZhang:《數據架構》閱讀筆記(八)非重複型分析BrianZhang:《數據架構》閱讀筆記(九)作業分析1BrianZhang:《數據架構》閱讀筆記(十)作業分析2BrianZhang:《數據架構》閱讀筆記(十一)個人分析軟體開發之路
推薦閱讀: