這里只討論字符串類型,int、datetime、text這些數據類型就不討論了,因為是否節省空間是根據數據類型來定的
在寫這篇文章之前,本人一直以為這個問題很簡單的,看一下數據頁就行了,但是后來寫着寫着,也修改了幾次
發現需要對SQSERVER的數據頁內容很熟悉您才能知道SQLSERVER內部空間占用是怎樣的,希望大家在繼續往下看之前先看一下下面文章
在往下看之前請各位先看一下下面的文章
char nchar varchar nvarchar的區別 :char nchar varchar nvarchar數據類型所占用長度
SQL Server誤區30日談-Day6-有關NULL位圖的三個誤區
如果不看上面的文章,對於剛入門的人來說可能只會是一知半解,為了文章的篇幅不要過長,我就在文章里不解釋一些重要名詞了
大家看一下給出的文章就可以了o(∩_∩)o
先建立下面表格並插入測試數據

建立一個DBCCResult表,保存DBCC IND的結果

查看各張表的情況
VARCHAR類型的情況
testnullvarchar表

數據頁內容

1 Slot 0 Offset 0x60 Length 11 2 3 Record Type = PRIMARY_RECORD Record Attributes = NULL_BITMAP 4 Memory Dump @0x0A16C060 5 6 00000000: 10000800 01000000 0200fe†††††††††††††........... 7 8 Slot 0 Column 0 Offset 0x4 Length 4 9 10 id = 1 11 NAME = [NULL] 12 13 Slot 1 Offset 0x6b Length 17 14 15 Record Type = PRIMARY_RECORD Record Attributes = NULL_BITMAP VARIABLE_COLUMNS 16 17 Memory Dump @0x0A16C06B 18 19 00000000: 30000800 02000000 0200fc01 001100c4 †0............... 20 00000010: e3†††††††††††††††††††††††††††††††††††. 21 22 Slot 1 Column 0 Offset 0x4 Length 4 23 24 id = 2 25 26 Slot 1 Column 1 Offset 0xf Length 2 27 28 NAME = 你
我們看第一行記錄長度11怎麽得出來的
在SQL Server頁中行物理存儲里對數據行的各段進行了解釋
2個字節行標頭存儲了狀態A和狀態B的信息(2 bytes row header)
2個字節存儲固定長度大小,因為一行記錄了有varchar這些不固定長度的數據類型(2 bytes for length of fixed length columns)
SQLSERVER需要知道int、datetime、decimal這些固定長度數據類型的大小
2個字節的列數,用來存儲這個表一共有多少列(2 bytes for number of columns in the table)
1個字節的null bitmap,(1 byte for null bitmap)
4個字節存儲int型數據(4 bytes for int (1st column))
2+2+2+1+4=11
換言之,第一行記錄中name字段不占用任何空間,因為第一行記錄中的name值為NULL
-------------------------------------------------------------------------------------------------------
我們看第二行記錄長度17怎麽得出來的
2個字節行標頭存儲了狀態A和狀態B的信息(2 bytes row header)
2個字節存儲固定長度大小,因為一行記錄了有varchar這些不固定長度的數據類型(2 bytes for length of fixed length columns)
SQLSERVER需要知道int、datetime、decimal這些固定長度數據類型的大小
2個字節的列數,用來存儲這個表一共有多少列(2 bytes for number of columns in the table)
1個字節的null bitmap,(1 byte for null bitmap)
4個字節存儲int型數據(4 bytes for int (1st column))
2個字節存儲數據行中的可變長度列數量,統計數據行中一共有多少列是nvarchar ,varchar類型的列( 2 bytes for number of variable length columns in the table)
2個字節存儲可變長度偏移陣列,可變長度偏移陣列的公式
2*表格中可變長度數據類型的列數量,這個表只有一列varchar,所以2*1=2,為什麽要有可變長度偏移陣列?我估計是因為可變長度的數據類型
存儲的數據是不固定的,所以要預留一些位置,當update varchar值的時候有足夠的位置(2 bytes for name column offset)
2個字節存儲name列的值,為什麽用兩個字節大家可以看一下char nchar varchar nvarchar的區別 2 bytes for name (你)
2+2+2+1+4+2+2+2=17
前11個字節跟第一行記錄是一樣的長度,關鍵在於后面的6個字節,在這6個字節中只有2個字節實際存儲數據的
為什麽在第一行記錄里沒有這4個字節呢?
2個字節存儲數據行中的可變長度列數量
2個字節存儲可變長度偏移陣列
想法:
我估計是因為,第一行記錄中沒有一個可變長度數據類型的列是有數據的,全部都是NULL,
既然這樣SQLSERVER就沒有必要再用4個字節去存儲2個字節存儲數據行中的可變長度列數量和2個字節存儲可變長度偏移陣列
我們來驗證一下這個想法:
代碼如下:

數據頁內容

我們看第一行記錄長度19怎麽得出來的
2個字節行標頭存儲了狀態A和狀態B的信息
2個字節存儲固定長度大小
2個字節的列數
1個字節的null bitmap
4個字節存儲int型數據
2個字節存儲數據行中的可變長度列數量
4個字節存儲可變長度偏移陣列 2*2=4
2個字節存儲name列的值
2+2+2+1+4+2+4+2=19
也就是說,一行記錄中全部的可變長度數據列的數據全部為NULL,才不會有這4個字節
2個字節存儲數據行中的可變長度列數量
2個字節存儲可變長度偏移陣列
其實SQLSERVER也做了一下標記,區分開一行記錄中全部的可變長度類型列的數據全部為NULL還是一些為NULL一些不為NULL,還是全部不為NULL
這里可以在行記錄屬性中看出,testnullvarchar表的第一行和第二行
第一行NULL_BITMAP表明一行記錄中全部的可變長度類型列的數據全部為NULL
第二行NULL_BITMAP VARIABLE_COLUMNS表明一些為NULL一些不為NULL或者全部不為NULL
小結:
VARCHAR類型NULL值不占用任何空間
testnotnullvarchar表

數據頁內容

1 Slot 0 Offset 0x60 Length 11 2 3 Record Type = PRIMARY_RECORD Record Attributes = NULL_BITMAP 4 Memory Dump @0x0855C060 5 6 00000000: 10000800 01000000 0200fc†††††††††††††........... 7 8 Slot 0 Column 0 Offset 0x4 Length 4 9 10 id = 1 11 NAME = [NULL] 12 13 Slot 1 Offset 0x6b Length 17 14 15 Record Type = PRIMARY_RECORD Record Attributes = NULL_BITMAP VARIABLE_COLUMNS 16 17 Memory Dump @0x0855C06B 18 19 00000000: 30000800 02000000 0200fc01 001100c4 †0............... 20 00000010: e3†††††††††††††††††††††††††††††††††††. 21 22 Slot 1 Column 0 Offset 0x4 Length 4 23 24 id = 2 25 26 Slot 1 Column 1 Offset 0xf Length 2 27 28 NAME = 你
testnotnullvarchar表的數據頁和testnullvarchar表的數據頁對比一下
看到上面的對比圖我也不再對testnotnullvarchar表做詳細分析了
情況跟testnullvarchar表是一樣的
只有一個地方不一樣,就是LEN()函數
小結:
對於varchar數據類型,無論是空字符串還是NULL值都不占用任何空間
CHAR類型的情況
testnullchar表

數據頁內容

1 Slot 0 Offset 0x60 Length 31 2 3 Record Type = PRIMARY_RECORD Record Attributes = NULL_BITMAP 4 Memory Dump @0x0A27C060 5 6 00000000: 10001c00 01000000 00000000 00000000 †................ 7 00000010: 00000000 00000000 00000000 0200fe††††............... 8 9 Slot 0 Column 0 Offset 0x4 Length 4 10 11 id = 1 12 NAME = [NULL] 13 14 Slot 1 Offset 0x7f Length 31 15 16 Record Type = PRIMARY_RECORD Record Attributes = NULL_BITMAP 17 Memory Dump @0x0A27C07F 18 19 00000000: 10001c00 02000000 c4e32020 20202020 †.......... 20 00000010: 20202020 20202020 20202020 0200fc†††† ... 21 22 Slot 1 Column 0 Offset 0x4 Length 4 23 24 id = 2 25 26 Slot 1 Column 1 Offset 0x8 Length 20 27 28 NAME = 你
我們看第一行記錄長度31怎麽得出來的
2個字節行標頭存儲了狀態A和狀態B的信息(2 bytes row header)
2個字節存儲固定長度大小,因為一行記錄了有varchar這些不固定長度的數據類型(2 bytes for length of fixed length columns)
4個字節存儲int型數據(4 bytes for int (1st column))
2個字節的列數,用來存儲這個表一共有多少列(2 bytes for number of columns in the table)
1個字節的null bitmap,(1 byte for null bitmap)
20個字節存儲name列的值,為什麽用20個字節大家可以看一下char nchar varchar nvarchar的區別 20 bytes for char(20) (2nd column)
2+2+4+2+1+20=31
換言之,第一行記錄中name字段是否為NULL,都占用20個字節的空間
-----------------------------------------------------------------------------------------
我們看第二行記錄長度31怎麽得出來的
實際上第二行記錄和第一行記錄是一樣的,只不過第二行記錄里的name列存儲了實際的值“你”,
而不管存儲的值大小如何都占用20個字節
2個字節行標頭存儲了狀態A和狀態B的信息(2 bytes row header)
2個字節存儲固定長度大小,因為一行記錄了有varchar這些不固定長度的數據類型(2 bytes for length of fixed length columns)
4個字節存儲int型數據(4 bytes for int (1st column))
2個字節的列數,用來存儲這個表一共有多少列(2 bytes for number of columns in the table)
1個字節的null bitmap,(1 byte for null bitmap)
20個字節存儲name列的值,為什麽用20個字節大家可以看一下char nchar varchar nvarchar的區別 20 bytes for char(20) (2nd column)
2+2+4+2+1+20=31
小結:
CHAR類型NULL值會占用空間,所占用空間大小取決於建表時候指定的char數據類型的大小
例如:
1 --允許空,char類型 2 CREATE TABLE testnullchar(id INT,NAME CHAR(20) NULL) 3 GO
指定char為20,那么就占用20個字節的空間
testnotnullchar表

數據頁內容

1 Slot 0 Offset 0x60 Length 31 2 3 Record Type = PRIMARY_RECORD Record Attributes = NULL_BITMAP 4 Memory Dump @0x0A01C060 5 6 00000000: 10001c00 01000000 20202020 20202020 †........ 7 00000010: 20202020 20202020 20202020 0200fc†††† ... 8 9 Slot 0 Column 0 Offset 0x4 Length 4 10 11 id = 1 12 13 Slot 0 Column 1 Offset 0x8 Length 20 14 15 NAME = 16 17 Slot 1 Offset 0x7f Length 31 18 19 Record Type = PRIMARY_RECORD Record Attributes = NULL_BITMAP 20 Memory Dump @0x0A01C07F 21 22 00000000: 10001c00 02000000 c4e32020 20202020 †.......... 23 00000010: 20202020 20202020 20202020 0200fc†††† ... 24 25 Slot 1 Column 0 Offset 0x4 Length 4 26 27 id = 2 28 29 Slot 1 Column 1 Offset 0x8 Length 20 30 31 NAME = 你
testnotnullchar表的數據頁和testnullchar表的數據頁對比一下
看到上面的對比圖我也不再對testnotnullchar表做詳細分析了
情況跟testnullchar表是一樣的
只有兩個地方不一樣,testnotnullchar表的第一行記錄的name字段存儲的是空字符串
而testnullchar表的第一行記錄的name字段存儲的是NULL
不過無論是空字符串還是NULL都占用了31個字節
LEN()函數返回的值不一樣,這里跟varchar類型的情況也是一樣的
跟varchar類型不一樣的是,testnotnullchar表的第一行記錄的name字段存儲的是空字符串,而testnullchar表的第一行記錄的name字段存儲的是NULL
varchar情況,testnotnullvarchar表和testnullvarchar表的第一行記錄的name字段存儲的都是NULL
而奇怪的是testnotnullvarchar表返回的不是NULL值,而是空字符串
小結:
對於char數據類型,無論是空字符串還是NULL值都占用空間,所占用空間大小取決於建表時候指定的char數據類型的大小
例如:
1 --允許空,char類型 2 CREATE TABLE testnullchar(id INT,NAME CHAR(20) NULL) 3 GO
指定char為20,那么就占用20個字節的空間
總結
對於varchar數據類型,無論是空字符串還是NULL值都不占用任何空間
對於char數據類型,無論是空字符串還是NULL值都占用空間,所占用空間大小取決於建表時候指定的char數據類型的大小
從上面的實驗來看,是否節省空間是根據數據類型來決定的而不是是否是NULL還是空字符串
撇開數據類型來比較是沒有意義的,就像DATETIME數據類型的數據列填入NULL值和VARCHAR數據類型的數據列填入NULL值,
兩個NULL值進行比較,哪一個大?如果不對兩種數據類型進行分析,單獨比較這兩個NULL值,這種比較是沒有意義的
而且也不平等,因為這兩種數據類型一點關系都沒有,一個datetime類型,一個是varchar類型
而char和varchar也是一樣
只有同一種數據類型的比較才有意義,就像同樣都是varchar數據類型,空字符串和NULL值進行比較
同樣都是char數據類型,空字符串和NULL值進行比較
所以平時要對SQLSERVER中的數據類型要有一定認識,才能對系統中的表空間的使用情況有大概的掌握
如有不對的地方,歡迎大家拍磚o(∩_∩)o