設計關系數據庫時,遵從不同的規范要求,設計出合理的關系型數據庫,這些不同的規范要求被稱為不同的范式,各種范式呈遞次規范,越高的范式數據庫冗余越小。
關系數據庫有六種范式:第一范式(1NF)、第二范式(2NF)、第三范式(3NF)、巴斯-科德范式(BCNF)、第四范式(4NF)和第五范式(5NF,又稱完美范式)。滿足最低要求的范式是第一范式(1NF)。在第一范式的基礎上進一步滿足更多規范要求的稱為第二范式(2NF),其余范式以次類推。一般來說,數據庫只需滿足第三范式(3NF)就行了。
1、第一范式(1NF):
所謂第一范式(1NF)是指在關系模型中,對於添加的一個規范要求,所有的域都應該是原子性的,即數據庫表的每一列都是不可分割的原子數據項,而不能是集合,數組,記錄等非原子數據項。即實體中的某個屬性有多個值時,必須拆分為不同的屬性。在符合第一范式(1NF)表中的每個域值只能是實體的一個屬性或一個屬性的一部分。簡而言之,第一范式就是無重復的域。
2、第二范式(2NF)
在1NF的基礎上,非碼屬性必須完全依賴於候選碼(在1NF基礎上消除非主屬性對主碼的部分函數依賴)
第二范式(2NF)是在第一范式(1NF)的基礎上建立起來的,即滿足第二范式(2NF)必須先滿足第一范式(1NF)。第二范式(2NF)要求數據庫表中的每個實例或記錄必須可以被唯一地區分。選取一個能區分每個實體的屬性或屬性組,作為實體的唯一標識。例如在員工表中的身份證號碼即可實現每個一員工的區分,該身份證號碼即為候選鍵,任何一個候選鍵都可以被選作主鍵。在找不到候選鍵時,可額外增加屬性以實現區分,如果在員工關系中,沒有對其身份證號進行存儲,而姓名可能會在數據庫運行的某個時間重復,無法區分出實體時,設計辟如ID等不重復的編號以實現區分,被添加的編號或ID選作主鍵。(該主鍵的添加是在ER設計時添加,不是建庫時隨意添加),第二范式(2NF)要求實體的屬性完全依賴於主關鍵字。
3、第三范式(3NF)
在2NF基礎上,任何非主屬性不依賴於其它非主屬性(在2NF基礎上消除傳遞依賴)
第三范式(3NF)是第二范式(2NF)的一個子集,即滿足第三范式(3NF)必須滿足第二范式(2NF)。簡而言之,第三范式(3NF)要求一個關系中不包含已在其它關系已包含的非主關鍵字信息。例如,存在一個部門信息表,其中每個部門有部門編號(dept_id)、部門名稱、部門簡介等信息。那么在員工信息表中列出部門編號后就不能再將部門名稱、部門簡介等與部門有關的信息再加入員工信息表中。如果不存在部門信息表,則根據第三范式(3NF)也應該構建它,否則就會有大量的數據冗余。簡而言之,第三范式就是屬性不依賴於其它非主屬性,也就是在滿足2NF的基礎上,任何非主屬性不得傳遞依賴於主屬性。
4、巴斯-科德范式(BCNF)
Boyce-Codd Normal Form(巴斯-科德范式)
在3NF基礎上,任何非主屬性不能對主鍵子集依賴(在3NF基礎上消除對主碼子集的依賴)
巴斯-科德范式(BCNF)是第三范式(3NF)的一個子集,即滿足巴斯-科德范式(BCNF)必須滿足第三范式(3NF)。通常情況下,巴斯-科德范式被認為沒有新的設計規范加入,只是對第二范式與第三范式中設計規范要求更強,因而被認為是修正第三范式,也就是說,它事實上是對第三范式的修正,使數據庫冗余度更小。這也是BCNF不被稱為第四范式的原因。某些書上,根據范式要求的遞增性將其稱之為第四范式是不規范,也是更讓人不容易理解的地方。而真正的第四范式,則是在設計規范中添加了對多值及依賴的要求。
總結:
可以這么簡單的理解:
第一范式:數據庫表的每一列都是不可再分割。
第二范式:滿足第一范式,且要求數據庫表中的每個實例或行必須可以被唯一的區分。
第三范式:滿足第二范式,且要求一個數據庫表中不包含已在其它表中已包含的非主關鍵字信息。