一、三大范式通俗解釋:
(1)簡單歸納:
第一范式(1NF):字段不可分;
第二范式(2NF):有主鍵,非主鍵字段依賴主鍵;
第三范式(3NF):非主鍵字段不能相互依賴。
(2)解釋:
1NF:原子性。 字段不可再分,否則就不是關系數據庫;;
2NF:唯一性 。一個表只說明一個事物;
3NF:每列都與主鍵有直接關系,不存在傳遞依賴。
二、例子說明
(1)不符合第一字段的例子
表:字段1, 字段2(字段2.1,字段2.2), 字段3
字段2可以拆分成字段2.1和字段2.2,不符合第一范式。
(2)不符合第二范式的例子
表:學號, 姓名, 年齡, 課程名稱, 成績, 學分
這個表明顯說明了兩個事務:學生信息, 課程信息。
1)存在以下問題:
a、數據冗余:每條記錄都含有相同信息;
b、刪除異常:刪除所有學生成績,就把課程信息全刪除了;
c、插入異常:學生未選課,無法記錄進數據庫;
d、更新異常:調整課程學分,所有行都調整。
2)修正:
學生表:學號, 姓名, 年齡
課程表:課程名稱,學分
選課關系表:學號, 課程名稱, 成績
(3)不符合第二范式的例子
表:學號, 姓名, 年齡, 所在學院, 學院聯系電話
其中關鍵字為單一關鍵字"學號"。存在依賴傳遞::(學號) → (所在學院) → (學院聯系電話) 。
1)存在問題::
a、數據冗余:有重復值;
b、更新異常:有重復的冗余信息,修改時需要同時修改多條記錄,否則會出現數據不一致的情況
c、刪除異常
2)修正:
學生表:學號, 姓名, 年齡, 所在學院;
學院表:學院, 電話
一范式就是屬性不可分割。屬性是什么?就是表中的字段。
不可分割的意思就按字面理解就是最小單位,不能再分成更小單位了。
這個字段只能是一個值,不能被拆分成多個字段,否則的話,它就是可分割的,就不符合一范式。
不過能不能分割並沒有絕對的答案,看需求,也就是看你的設計目標而定。
舉例:
學生信息組成學生信息表,有姓名、年齡、性別、學號等信息組成。
姓名不可拆分吧?所以可以作為該表的一個字段。
但我要說這個表要在國外使用呢?人家姓和名要分開,都有特別的意義,所以姓名字段是可拆分的,分為姓字段和名字段。
簡單來說,一范式是關系數據庫的基礎,但字段是否真的不可拆分,根據你的設計目標而定。
二范式就是要有主鍵,要求其他字段都依賴於主鍵。
為什么要有主鍵?沒有主鍵就沒有唯一性,沒有唯一性在集合中就定位不到這行記錄,所以要主鍵。
其他字段為什么要依賴於主鍵?因為不依賴於主鍵,就找不到他們。更重要的是,其他字段組成的這行記錄和主鍵表示的是同一個東西,而主鍵是唯一的,它們只需要依賴於主鍵,也就成了唯一的。
如果有同學不理解依賴這個詞,可以勉強用“相關”這個詞代替,也就是說其他字段必須和它們的主鍵相關。因為不相關的東西不應該放在一行記錄里。
舉例:
學生信息組成學生表,姓名可以做主鍵么?
不能!因為同名的話,就不唯一了,所以需要學號這樣的唯一編碼才行。
那么其他字段依賴於主鍵是什么意思?
就是“張三”同學的年齡和性別等字段,不能存儲別人的年齡性別,必須是他自己的,因為張三的學號信息就決定了,這行記錄歸張三所有,不能給無關人員使用。
三范式就是要消除傳遞依賴,方便理解,可以看做是“消除冗余”。
消除冗余應該比較好理解一些,就是各種信息只在一個地方存儲,不出現在多張表中。
比如說大學分了很多系(中文系、英語系、計算機系……),這個系別管理表信息有以下字段組成:
系編號,系主任,系簡介,系架構。
那么再回到學生信息表,張三同學的年齡、性別、學號都有了,我能不能把他的系編號,系主任、系簡介也一起存着?
如果你問三范式,當然不行,因為三范式不同意。
因為系編號,系主任、系簡介已經存在系別管理表中,你再存入學生信息表,就是冗余了。
三范式中說的傳遞依賴,就出現了。
這個時候學生信息表中,系主任信息是不是依賴於系編號了?而這個表的主鍵可是學號啊!
所以按照三范式,處理這個問題的時候,學生表就只能增加一個系編號字段。
這樣既能根據系編號找到系別信息,又避免了冗余存儲的問題。