【MySQL】探究之null與not null


相信很多用了mysql很久的人,對這兩個字段屬性的概念還不是很清楚,一般會有以下疑問:

  1. 我字段類型是not null,為什么我可以插入空值
  2. 為毛not null的效率比null高
  3. 判斷字段不為空的時候,到底要 select * from table where column <> '' 還是要用 select * from table where column is not null 呢。

帶着上面幾個疑問,我們來深入研究一下null 和 not null 到底有什么不一樣。 首先,我們要搞清楚“空值” 和 “NULL” 的概念: 1. 空值是不占用空間的 2. mysql中的NULL其實是占用空間的,下面是來自於MYSQL官方的解釋

“NULL columns require additional space in the row to record whether their values are NULL. For MyISAM tables, each NULL column takes one bit extra, rounded up to the nearest byte.”

打個比方來說,你有一個杯子,空值代表杯子是真空的,NULL代表杯子中裝滿了空氣,雖然杯子看起來都是空的,但是區別是很大的。

搞清楚“空值”和“NULL”的概念之后,問題基本就明了了,我們搞個例子測試一下:

CREATE TABLE `test` ( `col1` VARCHAR( 10 ) CHARACTER SET utf8 COLLATE utf8_general_ci NOT NULL , `col2` VARCHAR( 10 ) CHARACTER SET utf8 COLLATE utf8_general_ci NULL ) ENGINE = MYISAM ; 

插入測試

mysql> insert into test values(null,1); ERROR 1048 (23000): Column 'col1' cannot be null mysql> insert into test values('',null); Query OK, 1 row affected (0.00 sec) mysql> insert into test values('',1); Query OK, 1 row affected (0.00 sec) mysql> insert into test values('NULL',1); Query OK, 1 row affected (0.00 sec) mysql> select * from test; +------+------+ | col1 | col2 | +------+------+ | | NULL | | | 1 | | NULL | 1 | +------+------+ 3 rows in set (0.00 sec) 

可見,NOT NULL 的字段是不能插入NULL的,只能插入“空值”,上面的問題1也就有答案了。讀者需要注意的是,最后插入的NULL並非NULL,而是字符串"NULL"。並且對於InnoDB引擎的表具有相同的測試效果。

對於問題2,上面我們已經說過了,NULL 其實並不是空值,而是要占用空間,所以mysql在進行比較的時候,NULL 會參與字段比較,所以對效率有一部分影響。 而且B樹索引(MyISAM 表)時不會存儲NULL值的,所以如果索引的字段可以為NULL,索引的效率會下降很多。 值得注意的是:盡量避免NULL

  1. 很多表都包含可為NULL的列,即使應用程序並不需要保存NULL也是如此,這是因為可為NULL是列的默認屬性(TIMESTAMP除外),然而通常情況下最好指定列為NOT NULL,除非真的需要存儲NULL值。
  2. 如果查詢中包含可為NULL的列,對MySQL來說更難優化,因為可為NULL的列使得索引統計和值比較更加復雜。可為NULL的列會使用更多的存儲空間,在MySQL里也需要特殊的處理。當可為NULL的字段被索引時,每個索引記錄需要一個額外的字節,在MyASIM里甚至還可能導致固定大小的索引(例如只有一個整數列的索引)變成可變大小的索引。
  3. 通常把可為NULL的列改為NOT NULL 帶來的性能提升比較小,所以(調憂時)沒有必要首先在現有schema中查找並修改這種情況,除非確定這會導致問題。但是,如果計划在列上建索引,就應該盡量避免設計為NULL的列。當然也有一些例外,例如值得一提的是,InnoDB使用單獨的位(Bit)存儲NULL值,所以對於稀疏數據(很多值為NULL,只有少數行是非NULL)有很好的空間效率。但這一點不適用於MyISAM。

                                                                                                                                       ---引用自《高性能MySQL-第三版》第四章 Schema與數據類型優化

解決最后一個疑問 現在根據需求,我要統計test表中col1不為空的所有數據,我是該用“<> ''” 還是 “IS NOT NULL” 呢,讓我們來看一下結果的區別。

mysql> SELECT * FROM `test` WHERE col1 IS NOT NULL; +------+------+ | col1 | col2 | +------+------+ | NULL | 1 | | | 1 | | | NULL | +------+------+ 3 rows in set (0.00 sec) mysql> SELECT * FROM `test` WHERE col1 <> ''; +------+------+ | col1 | col2 | +------+------+ | NULL | 1 | +------+------+ 1 row in set (0.00 sec) 

可以看到,結果迥然不同,所以我們一定要根據業務需求,搞清楚到底是要用那種搜索條件。


免責聲明!

本站轉載的文章為個人學習借鑒使用,本站對版權不負任何法律責任。如果侵犯了您的隱私權益,請聯系本站郵箱yoyou2525@163.com刪除。



 
粵ICP備18138465號   © 2018-2025 CODEPRJ.COM