裝神必備:資料庫設計的範式
轉自朗沃Java團隊,原文鏈接:
裝神必備:資料庫設計的範式為了建立數據冗餘較小、結構合理的資料庫,設計資料庫時必須遵循一定的規則。在關係型資料庫中這種規則就稱為範式。範式是符合某一種設計要求的總結。要想設計一個結構合理的關係型資料庫,必須滿足一定的範式。
聽你這麼一說,範式好像蠻重要的樣子,那為何我不懂什麼範式,照樣把資料庫建立起來了,照樣可以存儲數據?
如果設計資料庫不遵守範式,後果就是你設計的資料庫雖然可以存儲數據,但是數據冗餘大,結構不合理,擴展性和維護性差。總之,一個字很垃圾:)
Dr E.F.codd最初定義了三個級別的範式,分別命名為第一範式、第二範式和第三範式。而這三個範式合在一起就是著名的資料庫設計三大範式。
下面跟我一起,一探究竟吧!
第一範式(1st NF -First Normal Fromate)
第一範式是最基本的範式。如果資料庫表中的所有欄位值都是不可分解的原子值,就說明該資料庫表滿足了第一範式。
第一範式的合理遵循需要根據系統的實際需求來定。
比如某些資料庫系統中需要用到「地址」這個屬性,本來直接將「地址」屬性設計成一個資料庫表的欄位就行。但是如果系統經常會訪問「地址」屬性中的「城市」部分,那麼就非要將「地址」這個屬性重新拆分為省份、城市、詳細地址等多個部分進行存儲,這樣在對地址中某一部分操作的時候將非常方便。這樣設計才算滿足了資料庫的第一範式,如下表所示。
上表所示的用戶信息遵循了第一範式的要求,這樣在對用戶使用城市進行分類的時候就非常方便,也提高了資料庫的性能。
第二範式(2nd NF-Second Normal Fromate)
第二範式在第一範式的基礎之上更進一層。第二範式需要確保資料庫表中的每一列都和主鍵相關,而不能只與主鍵的某一部分相關(主要針對聯合主鍵而言)。也就是說在一個資料庫表中,一個表中只能保存一種數據,不可以把多種數據保存在同一張資料庫表中。
比如要設計一個訂單信息表,因為訂單中可能會有多種商品,所以要將訂單編號和商品編號作為資料庫表的聯合主鍵,如下表所示。
這樣就產生一個問題:這個表中是以訂單編號和商品編號作為聯合主鍵。這樣在該表中商品名稱、單位、商品價格等信息不與該表的主鍵相關,而僅僅是與商品編號相關。所以在這裡違反了第二範式的設計原則。
而如果把這個訂單信息表進行拆分,把商品信息分離到另一個表中,把訂單項目表也分離到另一個表中,就非常完美了。如下所示。
這樣設計,在很大程度上減小了資料庫的冗餘。如果要獲取訂單的商品信息,使用商品編號到商品信息表中查詢即可。
第三範式(3rd NF- Third Normal Fromate)
第三範式在第二範式的基礎之上更進一層。第三範式需要確保數據表中的每一列數據都和主鍵直接相關,而不能間接相關。
比如在設計一個訂單數據表的時候,可以將客戶編號作為一個外鍵和訂單表建立相應的關係。而不可以在訂單表中添加關於客戶其它信息(比如姓名、所屬公司等)的欄位。如下面這兩個表所示的設計就是一個滿足第三範式的資料庫表。
這樣在查詢訂單信息的時候,就可以使用客戶編號來引用客戶信息表中的記錄,也不必在訂單信息表中多次輸入客戶信息的內容,減小了數據冗餘。
總結
- 第一範式:確保表中每列保持原子性
- 第二範式:確保表中每列都與主鍵相關
- 第三範式:確保表中每列都和主鍵列直接相關,而不是間接相關
掌握了資料庫設計三大範式這一技能,就可以幫助設計出合理的資料庫;也可以利用三大範式檢驗其他人資料庫設計是否合理。
看來資料庫設計三大範式,當之無愧是程序員裝神必備技能之一。
註:還存在更高級的範式,但關係模型不需要(甚至提及)它們,它們只用在某些需要避免冗餘的情況下。簡單的說,它們是Boyce-Codd範式、第四範式、第五範式…
推薦閱讀:
※Mysql高可用之Keepalived+mysql雙主
※BIM資料庫·標準導入助力建企轉型升級
※誰殺死了 MySQL? - 後記
※SQL中 LEFT JOIN ON 條件的效率高低比較?
※mysql已經有cache了,為啥還要在它前面加一層memcached?