為什么文件存儲要選用B+樹這樣的數據結構？

本文轉載自查看原文 2014-08-27 22:41 2599 數據結構

“文件存儲要選用B+樹這樣的數據結構”——沒記錯的話，這是嚴蔚敏那本數據結構書上的一句結論。不知道是我沒細看還是她沒細講，反正當時純粹應試地記了這么個結論。
不求甚解終究不是一個好的學習態度，一直以來我都沒有細想過這個事情，直到看到了這篇博文http://blog.csdn.net/v_JULY_v/article/details/6530142。

此文信息量很大，值得mark下來慢慢精讀。今天就暫記一下關於磁盤文件存儲選用B+ tree這一點以前沒深究過的問題。畢竟，好記性不如爛筆頭，雖然這篇里面ctrl-v擔當了比較多的任務……

另一個比較有趣的收獲是終於知道沒有B減樹這個東西了。以前老看到B-樹，以為對應着B+樹，是B樹的某一變種。但實際情況是：

B-樹，即為B樹。因為B樹的原英文名稱為B-tree，而國內很多人喜歡把B-tree譯作B-樹，其實，這是個非常不好的直譯，很容易讓人產生誤解。如人們可能會以為B-樹是一種樹，而B樹又是一種一種樹。而事實上是，B-tree就是指的B樹。

下面言歸正傳：

磁盤的構造

磁盤是一個扁平的圓盤(與電唱機的唱片類似)。盤面上有許多稱為磁道的圓圈，數據就記錄在這些磁道上。磁盤可以是單片的，也可以是由若干盤片組成的盤組，每一盤片上有兩個面。如下圖11.3中所示的6片盤組為例，除去最頂端和最底端的外側面不存儲數據之外，一共有10個面可以用來保存信息。

當磁盤驅動器執行讀/寫功能時。盤片裝在一個主軸上，並繞主軸高速旋轉，當磁道在讀/寫頭(又叫磁頭) 下通過時，就可以進行數據的讀 / 寫了。

一般磁盤分為固定頭盤(磁頭固定)和活動頭盤。固定頭盤的每一個磁道上都有獨立的磁頭，它是固定不動的，專門負責這一磁道上數據的讀/寫。

活動頭盤 (如上圖)的磁頭是可移動的。每一個盤面上只有一個磁頭(磁頭是雙向的，因此正反盤面都能讀寫)。它可以從該面的一個磁道移動到另一個磁道。所有磁頭都裝在同一個動臂上，因此不同盤面上的所有磁頭都是同時移動的(行動整齊划一)。當盤片繞主軸旋轉的時候，磁頭與旋轉的盤片形成一個圓柱體。各個盤面上半徑相同的磁道組成了一個圓柱面，我們稱為柱面。因此，柱面的個數也就是盤面上的磁道數。

磁盤的讀/寫原理和效率

磁盤上數據必須用一個三維地址唯一標示：柱面號、盤面號、塊號(磁道上的盤塊)。

讀/寫磁盤上某一指定數據需要下面3個步驟：

(1) 首先移動臂根據柱面號使磁頭移動到所需要的柱面上，這一過程被稱為定位或查找。

(2) 如上圖11.3中所示的6盤組示意圖中，所有磁頭都定位到了10個盤面的10條磁道上(磁頭都是雙向的)。這時根據盤面號來確定指定盤面上的磁道。

(3) 盤面確定以后，盤片開始旋轉，將指定塊號的磁道段移動至磁頭下。

經過上面三個步驟，指定數據的存儲位置就被找到。這時就可以開始讀/寫操作了。

訪問某一具體信息，由3部分時間組成：

● 查找時間(seek time) Ts: 完成上述步驟(1)所需要的時間。這部分時間代價最高，最大可達到0.1s左右。

● 等待時間(latency time) Tl: 完成上述步驟(3)所需要的時間。由於盤片繞主軸旋轉速度很快，一般為7200轉/分(電腦硬盤的性能指標之一, 家用的普通硬盤的轉速一般有5400rpm(筆記本)、7200rpm幾種)。因此一般旋轉一圈大約0.0083s。

● 傳輸時間(transmission time) Tt: 數據通過系統總線傳送到內存的時間，一般傳輸一個字節(byte)大概0.02us=2*10^(-8)s

磁盤讀取數據是以盤塊(block)為基本單位的。位於同一盤塊中的所有數據都能被一次性全部讀取出來。而磁盤IO代價主要花費在查找時間Ts上。因此我們應該盡量將相關信息存放在同一盤塊，同一磁道中。或者至少放在同一柱面或相鄰柱面上，以求在讀/寫信息時盡量減少磁頭來回移動的次數，避免過多的查找時間Ts。

所以，在大規模數據存儲方面，大量數據存儲在外存磁盤中，而在外存磁盤中讀取/寫入塊(block)中某數據時，首先需要定位到磁盤中的某塊，如何有效地查找磁盤中的數據，需要一種合理高效的外存數據結構。這種結構可以使得在查找過程中，IO次數盡量的少。

B- 樹

B 樹又叫平衡多路查找樹。

B 樹中的每個結點根據實際情況可以包含大量的關鍵字信息和分支(當然是不能超過磁盤塊的大小，根據磁盤驅動(disk drives)的不同，一般塊的大小在1k~4k左右)；這樣樹的深度降低了，這就意味着查找一個元素只要很少結點從外存磁盤中讀入內存，很快訪問到要查找的數據。相較於2叉樹的優勢就在於此了（降低了樹高）。

舉個例子，為了簡單，這里用少量數據構造一棵3叉樹的形式，實際應用中的B樹結點中關鍵字很多的。上面的圖中比如根結點，其中17表示一個磁盤文件的文件名；小紅方塊表示這個17文件的內容在硬盤中的存儲位置；p1表示指向17左子樹的指針。

下面，咱們來模擬下查找文件29的過程：

(1) 根據根結點指針找到文件目錄的根磁盤塊1，將其中的信息導入內存。【磁盤IO操作1次】

(2) 此時內存中有兩個文件名17，35和三個存儲其他磁盤頁面地址的數據。根據算法我們發現17<29<35，因此我們找到指針p2。

(3) 根據p2指針，我們定位到磁盤塊3，並將其中的信息導入內存。【磁盤IO操作2次】

(4) 此時內存中有兩個文件名26，30和三個存儲其他磁盤頁面地址的數據。根據算法我們發現26<29<30，因此我們找到指針p2。

(5) 根據p2指針，我們定位到磁盤塊8，並將其中的信息導入內存。【磁盤IO操作3次】

(6) 此時內存中有兩個文件名28，29。根據算法我們查找到文件29，並定位了該文件內存的磁盤地址。

分析上面的過程，發現需要3次磁盤IO操作和3次內存查找操作。關於內存中的文件名查找，由於是一個有序表結構，可以利用折半查找提高效率。至於3次磁盤IO操作時影響整個B樹查找效率的決定因素。

當然，如果我們使用平衡二叉樹的磁盤存儲結構來進行查找，磁盤IO操作最少4次，最多5次。而且文件越多，B樹比平衡二叉樹所用的磁盤IO操作次數將越少，效率也越高。

B+樹

B+-Tree是應文件系統所需而產生的一種B-tree的變形樹。

一棵m階的B+樹和m階的B樹的差異在於：

1.有n棵子樹的結點中含有n個關鍵字； (而B 樹是n棵子樹有n-1個關鍵字)

2.所有的葉子結點中包含了全部關鍵字的信息，及指向含有這些關鍵字記錄的指針，且葉子結點本身依關鍵字的大小自小而大的順序鏈接。 (而B 樹的葉子節點並沒有包括全部需要查找的信息)

3.所有的非終端結點可以看成是索引部分，結點中僅含有其子樹根結點中最大（或最小）關鍵字。 (而B 樹的非終節點也包含需要查找的有效信息)

為什么B+樹可以滿足要求？

1) B+-tree的磁盤讀寫代價更低

B+-tree的內部結點並沒有指向關鍵字具體信息的指針。因此其內部結點相對B 樹更小。如果把所有同一內部結點的關鍵字存放在同一盤塊中，那么盤塊所能容納的關鍵字數量也越多。一次性讀入內存中的需要查找的關鍵字也就越多。相對來說IO讀寫次數也就降低了。

舉個例子，假設磁盤中的一個盤塊容納16bytes，而一個關鍵字2bytes，一個關鍵字具體信息指針2bytes。一棵9階B-tree(一個結點最多8個關鍵字)的內部結點需要2個盤快。而B+ 樹內部結點只需要1個盤快。當需要把內部結點讀入內存中的時候，B 樹就比B+ 樹多一次盤塊查找時間(在磁盤中就是盤片旋轉的時間)。

2) B+-tree的查詢效率更加穩定

由於非終結點並不是最終指向文件內容的結點，而只是葉子結點中關鍵字的索引。所以任何關鍵字的查找必須走一條從根結點到葉子結點的路。所有關鍵字查詢的路徑長度相同，導致每一個數據的查詢效率相當。

B*-Tree

B*-tree是B+-tree的變體，在B+ 樹非根和非葉子結點再增加指向兄弟的指針；B*樹定義了非葉子結點關鍵字個數至少為(2/3)*M，即塊的最低使用率為2/3（代替B+樹的1/2）。給出了一個簡單實例，如下圖所示：

B+樹的分裂：當一個結點滿時，分配一個新的結點，並將原結點中1/2的數據復制到新結點，最后在父結點中增加新結點的指針；B+樹的分裂只影響原結點和父結點，而不會影響兄弟結點，所以它不需要指向兄弟的指針。

B*樹的分裂：當一個結點滿時，如果它的下一個兄弟結點未滿，那么將一部分數據移到兄弟結點中，再在原結點插入關鍵字，最后修改父結點中兄弟結點的關鍵字（因為兄弟結點的關鍵字范圍改變了）；如果兄弟也滿了，則在原結點與兄弟結點之間增加新結點，並各復制1/3的數據到新結點，最后在父結點增加新結點的指針。

所以，B*樹分配新結點的概率比B+樹要低，空間使用率更高；

總結

通過以上介紹，大致將B樹，B+樹，B*樹總結如下：

B樹：有序數組+平衡多叉樹；數據存在於非葉子節點上

B+樹：有序數組鏈表+平衡多叉樹；數據只存在於葉子上。

B*樹：一棵豐滿的B+樹。

走進搜索引擎的作者梁斌老師針對B樹、B+樹給出了他的意見：

“B+樹還有一個最大的好處，方便掃庫，B樹必須用中序遍歷的方法按序掃庫，而B+樹直接從葉子結點挨個掃一遍就完了，B+樹支持range-query非常方便，而B樹不支持。這是數據庫選用B+樹的最主要原因。

比如要查 5-10之間的，B+樹一把到5這個標記，再一把到10，然后串起來就行了，B樹就非常麻煩。B樹的好處，就是成功查詢特別有利，因為樹的高度總體要比B+樹矮。不成功的情況下，B樹也比B+樹稍稍占一點點便宜。 B樹比如你的例子中查，17的話，一把就得到結果了。
有很多基於頻率的搜索是選用B樹，越頻繁query的結點越往根上走，前提是需要對query做統計，而且要對key做一些變化。另外B樹也好B+樹也好，根或者上面幾層因為被反復query，所以這幾塊基本都在內存中，不會出現讀磁盤IO，一般已啟動的時候，就會主動換入內存。”

免責聲明！

本站轉載的文章為個人學習借鑒使用，本站對版權不負任何法律責任。如果侵犯了您的隱私權益，請聯系本站郵箱yoyou2525@163.com刪除。

猜您在找 數據結構（六）查找---多路查找樹（B+樹） Java數據結構和算法（七）B+ 樹 Mysql索引數據結構為什么是B+樹？面試問題之數據結構與算法：B樹、B+樹、B*樹 MySQL數據庫中索引的數據結構是什么？（B樹和B+樹的區別）數據結構 4 時間復雜度、B-樹 B+樹具體應用與理解數據結構（四）樹---樹的存儲結構 B+/-Tree原理（mysql索引數據結構）數據存儲檢索之B+樹和LSM-Tree 為什么MySQL數據庫要用B+樹存儲索引