《數據架構》閱讀筆記(十二完結篇)複合式的數據架構

《數據架構——大數據、數據倉庫以及Data Vault》,作者W.H. Inmon,DanielLinstedt,譯者唐富年,人民郵電出版社,2017年。

筆記中有些內容直接引用原書。

================================================================

複合數據架構有以下幾個值得關注的特徵。

1. 數據的時效性。一般來說,數據越新就會離交互環境越近,數據越舊則越可能被遷移到歸檔環境。

2. 交互環境的關鍵在於應用程序的執行。數據倉庫/Data Vault環境的本質就在於數據的集成。

3. 大數據組件可以分成兩個主要部分,即分析型大數據部分和歸檔型大數據部分。

4. 元數據可以橫跨不同的環境而不受限制。真正企業元數據在任何情況下都是跨數據的。元數據並不考慮數據的不同物理形態或者其他邊界。

5. 在整個複合架構中存在不同層面的元數據。

6. 該複合架構中描述了企業中詳細的、基礎性的數據(也就是記錄系統中的數據)。其他一些數據(包括匯總數據和合計數據)雖然存在於企業之中,但是在該複合架構中並未反映。(該複合架構中也並沒有反映數據集市。)

7. 在該複合架構中,數據類型有著根本性區別。非結構化數據(也就是非重複型數據)並不直接與基於事務處理的數據(也就是重複型數據)相混合。

BrianZhang:《數據架構》閱讀筆記(一)企業數據zhuanlan.zhihu.com圖標BrianZhang:《數據架構》閱讀筆記(二)大數據zhuanlan.zhihu.com圖標BrianZhang:《數據架構》閱讀筆記(三)數據倉庫zhuanlan.zhihu.com圖標BrianZhang:《數據架構》閱讀筆記(四)Data Vaultzhuanlan.zhihu.com圖標BrianZhang:《數據架構》閱讀筆記(五)作業環境zhuanlan.zhihu.com圖標BrianZhang:《數據架構》閱讀筆記(六)數據架構zhuanlan.zhihu.com圖標BrianZhang:《數據架構》閱讀筆記(七)重複型分析zhuanlan.zhihu.com圖標BrianZhang:《數據架構》閱讀筆記(八)非重複型分析zhuanlan.zhihu.com圖標BrianZhang:《數據架構》閱讀筆記(九)作業分析1zhuanlan.zhihu.com圖標BrianZhang:《數據架構》閱讀筆記(十)作業分析2zhuanlan.zhihu.com圖標BrianZhang:《數據架構》閱讀筆記(十一)個人分析zhuanlan.zhihu.com圖標軟體開發之路zhuanlan.zhihu.com圖標
推薦閱讀:

Apache HAWQ數據倉庫最佳實踐
星型模型和雪花型模型比較
建設數據倉庫的八個步驟
為什麼我們需要數據倉庫

TAG:大數據 | 數據倉庫 |