淺析MySQL索引結(jié)構(gòu)采用B+樹(shù)的問(wèn)題
一位6年經(jīng)驗(yàn)的小伙伴去字節(jié)面試的時(shí)候被問(wèn)到這樣一個(gè)問(wèn)題,為什么MySQL索引結(jié)構(gòu)要采用B+樹(shù)?這位小伙伴從來(lái)就沒(méi)有思考過(guò)這個(gè)問(wèn)題。只因?yàn)楝F(xiàn)在都這么卷,后面還特意查了很多資料,他也希望聽(tīng)聽(tīng)我的見(jiàn)解。
另外,我花了1個(gè)多星期把往期的面試題解析配套文檔準(zhǔn)備好了,一共有10萬(wàn)字,想獲取的小伙伴可以在我的煮葉簡(jiǎn)介中找到。
1、B樹(shù)和B+樹(shù)
一般來(lái)說(shuō),數(shù)據(jù)庫(kù)的存儲(chǔ)引擎都是采用B樹(shù)或者B+樹(shù)來(lái)實(shí)現(xiàn)索引的存儲(chǔ)。首先來(lái)看B樹(shù),如圖所示。
B樹(shù)是一種多路平衡樹(shù),用這種存儲(chǔ)結(jié)構(gòu)來(lái)存儲(chǔ)大量數(shù)據(jù),它的整個(gè)高度會(huì)相比二叉樹(shù)來(lái)說(shuō),會(huì)矮很多。
而對(duì)于數(shù)據(jù)庫(kù)而言,所有的數(shù)據(jù)都將會(huì)保存到磁盤(pán)上,而磁盤(pán)I/O的效率又比較低,特別是在隨機(jī)磁盤(pán)I/O的情況下效率更低。
所以 高度決定了磁盤(pán)I/O的次數(shù),磁盤(pán)I/O次數(shù)越少,對(duì)于性能的提升就越大,這也是為什么采用B樹(shù)作為索引存儲(chǔ)結(jié)構(gòu)的原因,如圖所示。
而MySQL的InnoDB存儲(chǔ)引擎,它用了一種增強(qiáng)的B樹(shù)結(jié)構(gòu),也就是B+樹(shù)來(lái)作為索引和數(shù)據(jù)的存儲(chǔ)結(jié)構(gòu)。
相比較于B樹(shù)結(jié)構(gòu)來(lái)說(shuō),B+樹(shù)做了兩個(gè)方面的優(yōu)化,如圖所示。
1、B+樹(shù)的所有數(shù)據(jù)都存儲(chǔ)在葉子節(jié)點(diǎn),非葉子節(jié)點(diǎn)只存儲(chǔ)索引。
2、葉子節(jié)點(diǎn)中的數(shù)據(jù)使用雙向鏈表的方式進(jìn)行關(guān)聯(lián)。
2、原因分析
我認(rèn)為,MySQL索引結(jié)構(gòu)采用B+樹(shù),有以下4個(gè)原因:
1、從磁盤(pán)I/O效率方面來(lái)看:B+樹(shù)的非葉子節(jié)點(diǎn)不存儲(chǔ)數(shù)據(jù),所以樹(shù)的每一層就能夠存儲(chǔ)更多的索引數(shù)量,也就是說(shuō),B+樹(shù)在層高相同的情況下,比B樹(shù)的存儲(chǔ)數(shù)據(jù)量更多,間接會(huì)減少磁盤(pán)I/O的次數(shù)。
2、從范圍查詢(xún)效率方面來(lái)看:在MySQL中,范圍查詢(xún)是一個(gè)比較常用的操作,而B(niǎo)+樹(shù)的所有存儲(chǔ)在葉子節(jié)點(diǎn)的數(shù)據(jù)使用了雙向鏈表來(lái)關(guān)聯(lián),所以B+樹(shù)在查詢(xún)的時(shí)候只需查兩個(gè)節(jié)點(diǎn)進(jìn)行遍歷就行,而B(niǎo)樹(shù)需要獲取所有節(jié)點(diǎn),因此,B+樹(shù)在范圍查詢(xún)上效率更高。
3、從全表掃描方面來(lái)看:因?yàn)?,B+樹(shù)的葉子節(jié)點(diǎn)存儲(chǔ)所有數(shù)據(jù),所以B+樹(shù)的全局掃描能力更強(qiáng)一些,因?yàn)樗恍枰獟呙枞~子節(jié)點(diǎn)。而B(niǎo)樹(shù)需要遍歷整個(gè)樹(shù)。
4、從自增ID方面來(lái)看:基于B+樹(shù)的這樣一種數(shù)據(jù)結(jié)構(gòu),如果采用自增的整型數(shù)據(jù)作為主鍵,還能更好的避免增加數(shù)據(jù)的時(shí)候,帶來(lái)葉子節(jié)點(diǎn)分裂導(dǎo)致的大量運(yùn)算的問(wèn)題。
3、總結(jié)
總體來(lái)說(shuō),我認(rèn)為技術(shù)方案的選型,更多的要根據(jù)具體的業(yè)務(wù)場(chǎng)景來(lái)決定,并不一定是說(shuō)B+樹(shù)就是最好的選擇,就像MongoDB里面采用B樹(shù)結(jié)構(gòu),本質(zhì)上來(lái)說(shuō),其實(shí)是關(guān)系型數(shù)據(jù)庫(kù)和非關(guān)系型數(shù)據(jù)庫(kù)的差異。
以上就是我對(duì)為什么MySQL索引結(jié)構(gòu)采用B+樹(shù) 的理解。
到此這篇關(guān)于淺析MySQL索引結(jié)構(gòu)采用B+樹(shù)的問(wèn)題的文章就介紹到這了,更多相關(guān)mysql 索引B+樹(shù)內(nèi)容請(qǐng)搜索腳本之家以前的文章或繼續(xù)瀏覽下面的相關(guān)文章希望大家以后多多支持腳本之家!
相關(guān)文章
MySQL深分頁(yè)問(wèn)題解決的實(shí)戰(zhàn)記錄
優(yōu)化項(xiàng)目代碼過(guò)程中發(fā)現(xiàn)一個(gè)千萬(wàn)級(jí)數(shù)據(jù)深分頁(yè)問(wèn)題,覺(jué)著有必要給大家總結(jié)整理下,這篇文章主要給大家介紹了關(guān)于解決MySQL深分頁(yè)問(wèn)題的相關(guān)資料,需要的朋友可以參考下2021-09-09MySQL 5.7.30 安裝與升級(jí)問(wèn)題詳細(xì)教程
這篇文章主要介紹了MySQL 5.7.30 的安裝與升級(jí)教程(所有可能的坑都在這里),本文通過(guò)圖文并茂的形式給大家介紹的非常詳細(xì),對(duì)大家的學(xué)習(xí)或工作具有一定的參考借鑒價(jià)值,需要的朋友可以參考下2020-05-05MySQL設(shè)置白名單限制的實(shí)現(xiàn)
白名單是一種機(jī)制,用于限制哪些主機(jī)可以連接到服務(wù)器,而阻止其他主機(jī)的訪問(wèn),本文主要介紹了MySQL設(shè)置白名單限制的實(shí)現(xiàn),具有一定的參考價(jià)值,感興趣的可以了解一下2024-08-08簡(jiǎn)單講解MySQL的數(shù)據(jù)庫(kù)復(fù)制方法
這篇文章主要介紹了簡(jiǎn)單講解MySQL的數(shù)據(jù)庫(kù)復(fù)制方法,利用到了常見(jiàn)的mysqldump工具,需要的朋友可以參考下2015-11-11關(guān)于MySQL中datetime和timestamp的區(qū)別解析
在MySQL中一些日期字段的類(lèi)型選擇為datetime和timestamp,那么對(duì)于這兩種類(lèi)型不同的應(yīng)用場(chǎng)景是什么呢,這篇文章主要介紹了關(guān)于MySQL中datetime和timestamp的區(qū)別解析,需要的朋友可以參考下2023-06-06MySQL數(shù)據(jù)庫(kù)JDBC編程詳解流程
JDBC是指Java數(shù)據(jù)庫(kù)連接,是一種標(biāo)準(zhǔn)Java應(yīng)用編程接口(?JAVA?API),用來(lái)連接?Java?編程語(yǔ)言和廣泛的數(shù)據(jù)庫(kù)。從根本上來(lái)說(shuō),JDBC?是一種規(guī)范,它提供了一套完整的接口,允許便攜式訪問(wèn)到底層數(shù)據(jù)庫(kù),本篇文章我們來(lái)了解MySQL連接JDBC的流程方法2022-01-01MySQL中TIMESTAMP類(lèi)型返回日期時(shí)間數(shù)據(jù)中帶有T的解決
這篇文章主要介紹了MySQL中TIMESTAMP類(lèi)型返回日期時(shí)間數(shù)據(jù)中帶有T的解決方案,具有很好的參考價(jià)值,希望對(duì)大家有所幫助。如有錯(cuò)誤或未考慮完全的地方,望不吝賜教2022-12-12mysql between實(shí)現(xiàn)選取介于兩個(gè)值之間的數(shù)據(jù)范圍
這篇文章主要介紹了mysql between實(shí)現(xiàn)選取介于兩個(gè)值之間的數(shù)據(jù)范圍,具有很好的參考價(jià)值,希望對(duì)大家有所幫助。如有錯(cuò)誤或未考慮完全的地方,望不吝賜教2022-07-07數(shù)據(jù)庫(kù)查詢(xún)優(yōu)化之子查詢(xún)優(yōu)化
今天小編就為大家分享一篇關(guān)于數(shù)據(jù)庫(kù)查詢(xún)優(yōu)化之子查詢(xún)優(yōu)化,小編覺(jué)得內(nèi)容挺不錯(cuò)的,現(xiàn)在分享給大家,具有很好的參考價(jià)值,需要的朋友一起跟隨小編來(lái)看看吧2019-01-01Mysql中報(bào)錯(cuò)函數(shù)floor()函數(shù)和rand()函數(shù)的配合使用及原理詳解
在項(xiàng)目中的SQL語(yǔ)句中遇到幾個(gè)數(shù)值處理函數(shù),看著有些懵,就小小的總結(jié)一下,這篇文章主要給大家介紹了關(guān)于Mysql中報(bào)錯(cuò)函數(shù)floor()函數(shù)和rand()函數(shù)的配合使用及原理的相關(guān)資料,需要的朋友可以參考下2022-07-07