第一范式:確保每列的原子性.
第一范式是最基本的范式。
數據庫表中的字段都是單一屬性的,不可再分。
只要是關系數據庫都滿足第一范式
如果每列(或者每個屬性)都是不可再分的最小數據單元(也稱為最小的原子單元),則滿足第一范式.
例如:顧客表(姓名、編號、地址、……)其中"地址"列還可以細分為國家、省、市、區等。
2.第二范式(確保表中的每列都和主鍵相關).
如果一個關系滿足第一范式,並且除了主鍵以外的其它列,都依賴於該主鍵,則滿足第二范式.
例如:訂單表(訂單編號、產品編號、定購日期、價格、……),"訂單編號"為主鍵,"產品編號"和主鍵列沒有直接的關系,即"產品編號"列不依賴於主鍵列,應刪除該列。
***********************************************************
不滿足第二范式,復合主鍵中的A與字段C組合重復
+------------+-----------+-------------------+
pk pk row
+------------+-----------+-------------------+
A B C
+------------+-----------+-------------------+
A D C
+------------+-----------+-------------------+
A E C
+------------+-----------+-------------------+
改為這樣滿足第二范式(但是不滿足第三范式,字段A與字段C是組合重復):
+---------+------------+-----------+-------------------+
pk row row row
+---------+------------+-----------+-------------------+
1 A B C
+---------+------------+-----------+-------------------+
2 A D C
+---------+------------+-----------+-------------------+
3 A E C
+---------+------------+-----------+-------------------+
****************************************************************
3.第三范式(確保每列都和主鍵列直接相關,而不是間接相關).
如果一個關系滿足第二范式,並且除了主鍵以外的其它列都不依賴於主鍵列,則滿足第三范式.
為了理解第三范式,需要根據Armstrong公里之一定義傳遞依賴。假設A、B和C是關系R的三個屬性,如果A-〉B且B-〉C,則從這些函數依賴中,可以得出A-〉C,如上所述,依賴A-〉C是傳遞依賴。
例如:訂單表(訂單編號,定購日期,顧客編號,顧客姓名,……),初看該表沒有問題,滿足第二范式,每列都和主鍵列"訂單編號"相關,再細看你會發現"顧客姓名"和"顧客編號"相關,"顧客編號"和"訂單編號"又相關,最后經過傳遞依賴,"顧客姓名"也和"訂單編號"相關。為了滿足第三范式,應去掉"顧客姓名"列,放入客戶表中。
**********************************************************************
不滿足第三范式,字段A與字段C組合重復
+---------+------------+-----------+-------------------+---------------+
pk row row row row
+---------+------------+-----------+-------------------+---------------+
1 A B C F
+---------+------------+-----------+-------------------+---------------+
2 A D C G
+---------+------------+-----------+-------------------+---------------+
3 A E C K
+---------+------------+-----------+-------------------+---------------+
改為這樣滿足第三范式:
表1
+---------+------------+-----------+
pk row row
+---------+------------+-----------+
1 A B
+---------+------------+-----------+
2 A D
+---------+------------+-----------+
3 A E
+---------+------------+-----------+
和表2
+---------+-------------------+------------+
pk row row
+---------+-------------------+------------+
1 C F
+---------+-------------------+------------+
2 C G
+---------+-------------------+------------+
3 C K
+---------+-------------------+------------+
************************原則:************************************
原則:當出現字段與字段的組合重復,如上的A和C的組合重復,首先要考慮的就是把他們拆分為2個表,具體是C拆到表1, 還是A拆到表1,看情況而定
關鍵要理解定義這種范式標准的主要目的是為了減少數據冗余,數據冗余產生的本質就是在一個表中存在字段與字段之間的一對多,或者多對多關系。解決這個幾對幾的關系問題,就能輕易實現滿足第三范式的數據庫設計。
****************************總結***************************
歸結起來3句話:
1NF:字段不可分;
2NF:有主鍵,非主鍵字段依賴主鍵;
3NF:非主鍵字段不能相互依賴;
解釋:
1NF:原子性 字段不可再分,否則就不是關系數據庫;
2NF:唯一性 一個表只說明一個事物;
3NF:每列都與主鍵有直接關系,不存在傳遞依賴;
不符合第一范式的例子(關系數據庫中create不出這樣的表):
表:字段1, 字段2(字段2.1, 字段2.2), 字段3 ......
存在的問題: 因為設計不出這樣的表, 所以沒有問題;
不符合第二范式的例子:
表:學號, 姓名, 年齡, 課程名稱, 成績, 學分;
這個表明顯說明了兩個事務:學生信息, 課程信息;
***********************存在問題: *********************
數據冗余,每條記錄都含有相同信息;
刪除異常:刪除所有學生成績,就把課程信息全刪除了;
插入異常:學生未選課,無法記錄進數據庫;
更新異常:調整課程學分,所有行都調整。
***********************修正:******************************
學生:Student(學號, 姓名, 年齡);
課程:Course(課程名稱, 學分);
選課關系:SelectCourse(學號, 課程名稱, 成績)。
滿足第2范式只消除了插入異常。
&&&&❤❤❤❤❤❤❤❤不符合第三范式的例子: ❤❤❤❤❤❤❤❤&&&&&&&&&&
學號, 姓名, 年齡, 所在學院, 學院聯系電話,關鍵字為單一關鍵字"學號";
存在依賴傳遞: (學號) → (所在學院) → (學院地點, 學院電話)
存在問題:
數據冗余:有重復值;
更新異常:有重復的冗余信息,修改時需要同時修改多條記錄,否則會出現數據不一致的情況
刪除異常
修正:
學生:(學號, 姓名, 年齡, 所在學院);
學院:(學院, 地點, 電話)。