B樹

　　B樹是一種查找樹，它最初啟發於二叉查找樹。

　　二叉查找樹的特點是每個非葉節點都只有兩個孩子節點。然而這種做法會導致當數據量非常大時，二叉查找樹的深度過深，搜索算法自根節點向下搜索時，需要訪問的節點也就變的相當多。

　　如果這些節點存儲在外存儲器中，每訪問一個節點，相當於就是進行了一次I/O操作，隨着樹高度的增加，頻繁的I/O操作一定會降低查詢的效率。

磁盤讀取信息：

　　找到存儲這個數據所對應的磁盤頁面，這個過程是機械化的過程，需要依靠磁臂的轉動，找到對應磁道，所以耗時長。

　　讀取數據進內存，並實施運算，這是電子化的過程，相當快。

　　對於外存儲器的信息讀取最大的時間消耗在於尋找磁盤頁面。那么一個基本的想法就是能不能減少這種讀取的次數，在一個磁盤頁面上，多存儲一些索引信息。

　　B樹的基本邏輯就是這個思路，它要改二叉為多叉，每個節點存儲更多的指針信息，以降低I/O操作數。

這里用最小度 $t$

一個標准的B樹如下圖：

一棵已經建立好的B樹如下圖所示，我們的目的是查找關鍵字為29的文件：

先簡單對上圖說明一下：

下面，看看搜索關鍵字的29的文件的過程：

　　由上面的過程可見，同樣的操作，如果使用平衡二叉樹，那么需要至少4次I/O操作，B樹比之二叉樹的這種優勢，還會隨着節點數的增加而增加。

　　另外，因為B樹節點中的關鍵字都是排序好的，所以，在節點中的信息被讀入內存之后，可以采用二分查找這種快速的查找方式，更進一步減少了讀入內存之后的計算時間。

B+樹

　　B+樹是B樹的一種變形，它更適合實際應用中操作系統的文件索引和數據庫索引。

　　定義如下：（這里使用階數 $m$

　　除根節點外的內部節點，每個節點最多有 $m$

　　根節點要么沒有子樹，要么至少有2棵子樹；

　　所有的葉子節點包含了全部的關鍵字以及這些關鍵字指向文件的指針

　　所有葉子節點中的關鍵字按大小順序排列

　　相鄰的葉子節點順序鏈接（相當於是構成了一個順序鏈表）

　　所有葉子節點在同一層

比如，下圖就是一個非常典型的B+樹的例子。

B+樹和B樹相比，主要的不同點在以下3項：

　　（1）B+樹的非葉子節點不保存關鍵字記錄的指針，這樣使得B+樹每個節點所能保存的關鍵字大大增加；

　　（2）B+樹葉子節點保存了父節點的所有關鍵字和關鍵字記錄的指針，每個葉子節點的關鍵字從小到大鏈接；

　　（3）B+樹的根節點關鍵字數量和其子節點個數相等;

　　（4）B+的非葉子節點只進行數據索引，不會存實際的關鍵字記錄的指針，所有數據地址必須要到葉子節點才能獲取到，所以每次數據查詢的次數都一樣；

根據B+樹的結構，我們可以發現B+樹相比於B樹，在文件系統，數據庫系統當中，更有優勢，原因如下：

B+樹的磁盤讀寫代價更低
　　B+樹的內部結點並沒有指向關鍵字具體信息的指針。因此其內部結點相對B樹更小。如果把所有同一內部結點的關鍵字存放在同一盤塊中，那么盤塊所能容納的關鍵字數量也越多。一次性讀入內存中的需要查找的關鍵字也就越多。相對來說I/O讀寫次數也就降低了。

B+樹的查詢效率更加穩定
　　由於內部結點並不是最終指向文件內容的結點，而只是葉子結點中關鍵字的索引。所以任何關鍵字的查找必須走一條從根結點到葉子結點的路。所有關鍵字查詢的路徑長度相同，導致每一個數據的查詢效率相當。

B+樹更有利於對數據庫的掃描
　　B樹在提高了磁盤IO性能的同時並沒有解決元素遍歷的效率低下的問題，而B+樹只需要遍歷葉子節點就可以解決對全部關鍵字信息的掃描，所以對於數據庫中頻繁使用的range query，B+樹有着更高的性能。

參考：https://blog.csdn.net/guoziqing506/article/details/64122287

本站轉載的文章為個人學習借鑒使用，本站對版權不負任何法律責任。如果侵犯了您的隱私權益，請聯系本站郵箱yoyou2525@163.com刪除。

猜您在找 B樹和B+樹 b樹和b+樹 B樹和B+樹 B樹,B+樹 B 樹、B+ 樹、B* 樹 B樹和B+樹什么是B+樹 B+樹索引 B+樹索引什么是B+樹