快捷導(dǎo)航

MySQL中B樹索引和B+樹索引的區(qū)別詳解

更新時間：2022年03月02日 16:32:52 作者：小小茶花女

這篇文章主要為大家詳細介紹了MySQL中B樹索引和B+樹索引的區(qū)別，文中示例代碼介紹的非常詳細，具有一定的參考價值，感興趣的小伙伴們可以參考一下，希望能夠給你帶來幫助

如果用樹作為索引的數(shù)據(jù)結(jié)構(gòu)，每查找一次數(shù)據(jù)就會從磁盤中讀取樹的一個節(jié)點，也就是一頁，而二叉樹的每個節(jié)點只存儲一條數(shù)據(jù)，并不能填滿一頁的存儲空間，那多余的存儲空間豈不是要浪費了？為了解決二叉平衡搜索樹的這個弊端，我們應(yīng)該尋找一種單個節(jié)點可以存儲更多數(shù)據(jù)的數(shù)據(jù)結(jié)構(gòu)，也就是多路搜索樹。

1. 多路搜索樹

1、完全二叉樹高度：O(log2N)，其中2為對數(shù)，樹每層的節(jié)點數(shù)；

2、完全M路搜索樹的高度：O(logmN)，其中M為對數(shù)，樹每層的節(jié)點數(shù)；

3、M路搜索樹主要用于解決數(shù)據(jù)量大無法全部加載到內(nèi)存的數(shù)據(jù)存儲。通過增加每層節(jié)點的個數(shù)和在每個節(jié)點存放更多的數(shù)據(jù)來在一層中存放更多的數(shù)據(jù)，從而降低樹的高度，在數(shù)據(jù)查找時減少磁盤訪問次數(shù)。

4、所以每層的節(jié)點數(shù)和每個節(jié)點包含的關(guān)鍵字越多，則樹的高度越矮。但是在每個節(jié)點確定數(shù)據(jù)就越慢，但是B樹關(guān)注的是磁盤性能瓶頸，所以在單個節(jié)點搜索數(shù)據(jù)的開銷可以忽略。

2. B樹-多路平衡搜索樹

B樹是一種M路搜索樹，B樹主要用于解決M路搜索樹的不平衡導(dǎo)致樹的高度變高，跟二叉樹退化為鏈表導(dǎo)致性能問題一樣。B樹通過對每層的節(jié)點進行控制、調(diào)整，如節(jié)點分離，節(jié)點合并，一層滿時向上分裂父節(jié)點來增加新的層等操作來來保證該M路搜索樹的平衡。

M為B樹的階數(shù)或者說是路數(shù)，在B樹中，每個節(jié)點都是一個磁盤塊(頁)。每個非葉子節(jié)點存放了關(guān)鍵字和指向兒子樹的指針，具體數(shù)量為：M階的B樹，每個非葉子節(jié)點存放了M-1個關(guān)鍵字和M個指向子樹的指針。如圖為5階B樹結(jié)構(gòu)的示意圖：

在這里插入圖片描述

3. B樹索引

首先創(chuàng)建一張user表：

create table user(
	id int,
	name varchar,
	primary key(id)
) ROW_FORMAT=COMPACT;

假如我們使用B樹對表中的用戶記錄建立索引：

在這里插入圖片描述

B樹的每個節(jié)點占用一個磁盤塊，磁盤塊也就是頁，從上圖可以看出，B樹相對于平衡二叉樹，每個節(jié)點存儲了更多的主鍵key和數(shù)據(jù)data，并且每個節(jié)點擁有了更多的子節(jié)點，子節(jié)點的個數(shù)一般稱為階，上述圖中的B樹為3階B樹，高度也會降低。假如我們要查找id=28的用戶信息，那么查找流程如下：

1、根據(jù)根節(jié)點找到頁1，讀入內(nèi)存。【磁盤I/O操作第1次】

2、比較鍵值28在區(qū)間（17,35），找到頁1的指針p2；

3、根據(jù)p2指針找到頁3，讀入內(nèi)存?！敬疟PI/O操作第2次】

4、比較鍵值28在區(qū)間（26,35），找到頁3的指針p2。

5、根據(jù)p2指針找到頁8，讀入內(nèi)存。【磁盤I/O操作第3次】

6、在頁8中的鍵值列表中找到鍵值28，鍵值對應(yīng)的用戶信息為(28,po)；

B-Tree相對于AVLTree縮減了節(jié)點個數(shù)，使每次磁盤I/O取到內(nèi)存的數(shù)據(jù)都發(fā)揮了作用，從而提高了查詢效率。

4. B+樹索引

B+Tree是在B-Tree基礎(chǔ)上的一種優(yōu)化，使其更適合實現(xiàn)外存儲索引結(jié)構(gòu)，B+樹的性質(zhì)：

1、非葉子節(jié)點的子樹指針與關(guān)鍵字個數(shù)相同；

2、為所有葉子節(jié)點增加一個鏈指針；

3、所有關(guān)鍵字都在葉子節(jié)點出現(xiàn)，且鏈表中的關(guān)鍵字恰好是有序的；

4、非葉子節(jié)點相當于是葉子節(jié)點的索引,葉子節(jié)點相當于是存儲(關(guān)鍵字)數(shù)據(jù)的數(shù)據(jù)層；

InnoDB存儲引擎就是用B+Tree實現(xiàn)其索引結(jié)構(gòu)。

從上一節(jié)中的B-Tree結(jié)構(gòu)圖中可以看到每個節(jié)點中不僅包含數(shù)據(jù)的key值，還有data值。而每一個頁的存儲空間是有限的，如果data數(shù)據(jù)較大時將會導(dǎo)致每個節(jié)點（即一個頁）能存儲的key的數(shù)量很小，當存儲的數(shù)據(jù)量很大時同樣會導(dǎo)致B-Tree的深度較大，增大查詢時的磁盤I/O次數(shù)，進而影響查詢效率。在B+Tree中，所有數(shù)據(jù)記錄節(jié)點都是按照鍵值大小順序存放在同一層的葉子節(jié)點上，而非葉子節(jié)點上只存儲key值信息，這樣可以大大加大每個節(jié)點存儲的key值數(shù)量，降低B+Tree的高度。

B+Tree相對于B-Tree有幾點不同：

1、非葉子節(jié)點只存儲鍵值信息和指向子節(jié)點頁號的指針；

2、所有葉子節(jié)點之間都有一個鏈指針；

3、數(shù)據(jù)記錄都存放在葉子節(jié)點中；

在這里插入圖片描述

根據(jù)上圖我們來看下 B+ 樹和 B 樹有什么不同：

(1) B+ 樹非葉子節(jié)點上是不存儲數(shù)據(jù)的，僅存儲鍵值，而 B 樹節(jié)點中不僅存儲鍵值，也會存儲數(shù)據(jù)。

頁的大小是固定的，InnoDB 中頁的默認大小是 16KB。如果不存儲數(shù)據(jù)，那么就會存儲更多的鍵值，相應(yīng)的樹的階數(shù)就會更大，樹就會更矮更胖，如此一來我們查找數(shù)據(jù)進行磁盤的 IO 次數(shù)又會再次減少，數(shù)據(jù)查詢的效率也會更快。

另外，如果我們的 B+ 樹一個節(jié)點可以存儲 1000 個鍵值，那么 3 層 B+ 樹可以存儲 1000×1000×1000=10 億個數(shù)據(jù)。一般根節(jié)點是常駐內(nèi)存的(第一次檢索根節(jié)點不用讀取磁盤)，所以一般我們查找 10 億數(shù)據(jù)，只需要 2 次磁盤 IO。

(2) B+ 樹索引的所有數(shù)據(jù)均存儲在葉子節(jié)點，而且數(shù)據(jù)是按照順序排列的。

B+ 樹中各個頁之間是通過雙向鏈表連接的，葉子節(jié)點中的數(shù)據(jù)是通過單向鏈表連接的，通過這種方式可以找到表中的所有數(shù)據(jù)。B+ 樹使得范圍查找，排序查找，分組查找以及去重查找變得異常簡單。而 B 樹因為數(shù)據(jù)分散在各個節(jié)點，要實現(xiàn)這一點是很不容易的。