表是Oracle數據庫中最基本的對象之一。萬丈高樓從平地起,這個基礎對象對於數據庫來說,非常重要。因為其設計是否合理,直接跟數據庫的性能相關。從Oracle數據庫菜鳥到數據庫專家這個過程中,在表設計與管理上,或多或少,會犯一些錯誤。筆者今天就談談自己在這方面的經驗與教訓,或許能夠給大家一些警示作用。
表是Oracle數據庫中最基本的對象之一。萬丈高樓從平地起,這個基礎對象對於數據庫來說,非常重要。因為其設計是否合理,直接跟數據庫的性能相關。從Oracle數據庫菜鳥到數據庫專家這個過程中,在表設計與管理上,或多或少,會犯一些錯誤。筆者今天就談談自己在這方面的經驗與教訓,或許能夠給大家一些警示作用。
經驗一:在設計大型數據庫時,把允許NULL的列放在表的后面。
在數據庫表設計過程中,有些字段要求必須為非空,如表的關鍵字,單據編號字段等等。在數據庫表創建的時候,往往需要把這些字段設置為非空。如此的話,就可以強制用戶輸入數據,以增強數據的一致性。
同時,在一張表中,也會有不少的字段,如員工信息表中,員工愛好、注釋等字段,就可能允許為空。利用數據庫專業術語來說,這些沒有內容的字段就是“NULL”字段。
在數據庫表設計的時候,對於這種類型的空字段要特別的留意。一方面,這個NULL字段,不是說其里面存儲的是空格。若利用“’’”這個符號去查詢空字段的記錄的話,往往查不到我們想要的結果。因為在數據庫存儲的時候,若字段為NULL,則這個值根本沒有存儲。另一方面,正因為上面這種特性,所以,在表設計的時候,最好把允許NULL的字段放在表的末尾,當數據庫比較大或者空字段比較多的話,則可以大大的減少數據庫的存儲空間。
另外,在數據庫創建表的時候,是按照列建立的時間來排序的。所以,當某個列建立好之后,除非重新刪除再建立,否則無法調整列的順序。這就要求數據庫管理員在創建表之前,就要對列、以及是否為空有一個明確的定義。只有如此,才能夠合理安排列的順序。
經驗二:養成勤於寫注釋的習慣。
判斷一個人是否是數據庫專家,從一個“注釋”的小習慣中就可以 看得出來。若一個人在數據庫開發的時候,勤與寫注釋,如在建立表或者字段的時候,能夠利用comment命令對表與字段進行注釋,則可以從一定程度上判斷他是這方面的行家。相反,若其開發的數據庫,注釋沒有多少,則基本可以判斷,他是一個剛入門的菜鳥。或者說,其沒有參加過大型數據庫的設計。
這主要是因為,在數據庫開發過程中,往往不是一個人可以完成的。如在開發一個ERP數據庫的時候,可能有些人專門負責開發基礎表,而有些人負責維護視圖,等等。大家都是分工合作。同時,在前台也有程序員需要調用后台的數據庫表與字段。所以,中大型的數據庫與應用系統往往是大家協作的結果。
為此,為了提高表與字段的可讀性,一個數據庫管理人員開發的表格,大家都可以看的懂,就需要給表與字段設置比較詳盡的注釋。在Oracle數據庫中,為了給其他伙伴提供有意義的幫助信息,就可以利用Comment命令來描述表、字段的作用以及一些引用的注意事項。這個小小的命令,可以大大提高表與字段的可讀性,提高數據庫與程序開發團隊的協作性。
經驗三:選擇合適的數據類型與長度。
雖然數據庫系統在處理數據時,某些數據類型是兼容的,或者會對相關的數據類型進行自動的轉換。如對於一些日期類型的字段,其也可以賦值給字符類型的字段;整數型的字段跟浮點型的數據類型也是兼容的。但是,數據庫設計人員不能因為數據庫系統的這個特性,就放寬了對數據類型的把關。因為有時候,如在基礎數據導入或者數據成批更新的時候,雖然最后可以成功完成任務。但是,數據庫在這個過程中,需要進行數據類型的轉換,就額外的增加了數據庫的負擔。
另外,在數據庫設計的時候,也需要考慮字段的長度。若在建立表的時候,字段設計的太長,則會浪費存儲空間。相反,若設計的太短的話,會影響前台系統的使用。所以,數據庫管理員對於字段的長度,也要引起足夠的重視。
再者,若在創建字段的時候,不能夠確認字段長度的話,則最好采用變長的數據類型。如以字符型數據類型為例,就有CHAR與VARHAR2兩種。其中,CHAR字符類型主要用來存儲固定長度的字符串,允許的最大長度為2000字節。若實際存儲的信息內容不到定義的位數的話,則系統會在這些列值為部添加空格,直到其長度到為止。可見,若采用固定長度字段類型的話,即使數據沒有這么多,也會占用這么多的存儲空間。所以,這種方式下,存儲空間的浪費會比較大。后者主要用來存儲可變長度的字符數據。當在VARCHAR2列中插入的數據,如果沒有到其最大位數的話,則數據庫不會在尾部添加空格。從而可以讓空間利用最大化。
所以,在表設計的時候,數據庫管理員要選擇合適的數據類型,並且為其設置合適的長度。
經驗四:確定表需要采用的完整性約束與默認值。
有些數據庫管理員在數據庫設計的時候,喜歡邊設計邊開發。如在設計表的時候,一開始不確定那些字段要添加約束,哪些字段不能為空,哪些字段需要什么默認值等等。等到需要的時候,再隨意添加。這種做事方式,往往會給數據庫帶來不穩定的隱患。
如某個數據庫管理人員在建立表的時候,一開始沒有給某個字段設置為默認值。后來前台程序開發人員說需要給這個字段添加某個默認值。但是,此時這個表中已經有了跟系統相關的基礎數據。有了數據的表格后,往往不允許再重新設置默認值。否則的話,會給數據庫造成一定的負面影響。
所以,筆者認為,數據庫管理員在建立表之前,需要確定表所需要的完整性。如哪些列作為主鍵;哪些列作為外鍵;哪些列需要唯一性等等。
經驗五:確定表需要采用的類型。
在Oralce數據庫中,存儲用戶數據可以使用標准表、索引表、築表和分區表。有時候,基於不用的應用,選擇不同類型的數據表,往往可以大大的提高數據庫的性能,特別是數據查詢的效率。
如在合適的情況下,數據庫管理員可以使用築表節省存儲空間並提高特定類型的SQL語句的性能。不過,我們平時利用的比較多的出了基本表之外,就是索引表了。因為索引表在某些特殊的應用下,可以表現出很好的性能。如在索引表中,可以通過溢出存儲功能提高常用列的查詢速度;如果經常需要通過主鍵來查詢整條記錄的話,則利用索引表可以明顯提高查詢效率。當然,索引表也不能夠亂用。若索引表所存儲的數據,變化比較頻繁的話,則采用索引表這種類型的表格,反而會事倍功半。
所以,為數據庫表選擇合適的類型,可以大幅度的提高數據庫的性能。當數據庫的記錄數量越大,這種優勢就越明顯。
總之,筆者認為,在Oracle數據庫設計中,表的建立雖然是一項基礎工作。但是,有時候對於數據庫的性能,比其他內容影響更加深遠。所以,我們要重視表的設計,從基礎做起,為提升數據庫的性能而努力。