欧美bbbwbbbw肥妇,免费乱码人妻系列日韩,一级黄片

MySQL使用B+Tree當(dāng)索引的優(yōu)勢(shì)有哪些

 更新時(shí)間:2021年03月22日 11:49:45   作者:葉夢(mèng)  
這篇文章主要介紹了MySQL使用B+Tree當(dāng)索引有哪些優(yōu)勢(shì),幫助大家更好的理解和學(xué)習(xí)使用MySQL,感興趣的朋友可以了解下

數(shù)據(jù)庫(kù)為什么需要索引呢?

我們都是知道數(shù)據(jù)庫(kù)的數(shù)據(jù)都是存儲(chǔ)在磁盤上的,當(dāng)我們程序啟動(dòng)起來(lái)的時(shí)候,就相當(dāng)于一個(gè)進(jìn)程運(yùn)行在了機(jī)器的內(nèi)存當(dāng)中。所以當(dāng)我們程序要查詢數(shù)據(jù)時(shí),必須要從內(nèi)存出來(lái)到磁盤里面去查找數(shù)據(jù),然后將數(shù)據(jù)寫回到內(nèi)存當(dāng)中。但是磁盤的io效率是遠(yuǎn)不如內(nèi)存的,所有查找數(shù)據(jù)的快慢直接影響程序運(yùn)行的效率。
而數(shù)據(jù)庫(kù)加索引的主要目的就是為了使用一種合適的數(shù)據(jù)結(jié)構(gòu),可以使得查詢數(shù)據(jù)的效率變高,減少磁盤io的次數(shù),提升數(shù)據(jù)查找的速率,而不再是愣頭青式的全局遍歷。

那索引為啥要用B+Tree的數(shù)據(jù)結(jié)構(gòu)呢?

如果我們簡(jiǎn)單的想的話,想要快速的查找到數(shù)據(jù),感覺(jué)hash表是最快的,根據(jù)key,hash到某個(gè)槽位上,直接一次查找就可以準(zhǔn)確的找到數(shù)據(jù)的位置,這多快呀。但是我們?cè)谧鰳I(yè)務(wù)時(shí),往往只需要一條的數(shù)據(jù)需求很少,大部分的需求都是根據(jù)一定的條件查詢一部分的數(shù)據(jù),這個(gè)時(shí)候hash顯示不是很合適。

我們?cè)倏紤]樹(shù),比如二叉樹(shù),平衡二叉樹(shù),紅黑樹(shù),B樹(shù)等,他們都是二分查找,找數(shù)也快,但是不管是平衡二叉樹(shù)還是優(yōu)化后的紅黑樹(shù),說(shuō)到底他們都是二叉樹(shù),當(dāng)節(jié)點(diǎn)多了的時(shí)候,它們的高度就會(huì)高呀,我找一個(gè)數(shù)據(jù)。根節(jié)點(diǎn)不是,那就找下一層,下一層還沒(méi)有我就再去找下一層,這樣造成的后果就是我找一個(gè)數(shù)據(jù)可能要找好幾次,而每一次都是執(zhí)行了一次磁盤的io,而我們的索引的目的就是要減少磁盤io呀,這樣設(shè)計(jì)可不行。那我們是不是把高度變矮就可以了呢?
所以我們?cè)倏紤]下B樹(shù)。首先簡(jiǎn)單介紹下B樹(shù)的數(shù)據(jù)結(jié)構(gòu):
首先看看B樹(shù)的定義。

  1. 每個(gè)節(jié)點(diǎn)最多有m-1個(gè)關(guān)鍵字(可以存有的鍵值對(duì))。
  2. 根節(jié)點(diǎn)最少可以只有1個(gè)關(guān)鍵字。
  3. 非根節(jié)點(diǎn)至少有m/2關(guān)鍵字。
  4. 每個(gè)節(jié)點(diǎn)中的關(guān)鍵字都按照從小到大的順序排列,每個(gè)關(guān)鍵字的左子樹(shù)中的所有關(guān)鍵字都小于它,而右子樹(shù)中的所有關(guān)鍵字都大于它。
  5. 所有葉子節(jié)點(diǎn)都位于同一層,或者說(shuō)根節(jié)點(diǎn)到每個(gè)葉子節(jié)點(diǎn)的長(zhǎng)度都相同。
  6. 每個(gè)節(jié)點(diǎn)都存有索引和數(shù)據(jù),也就是對(duì)應(yīng)的key和value。

所以,根節(jié)點(diǎn)的關(guān)鍵字?jǐn)?shù)量范圍:1 <= k <= m-1,非根節(jié)點(diǎn)的關(guān)鍵字?jǐn)?shù)量范圍:m/2 <= k <= m-1。

這里的m表示階數(shù),階數(shù)表示了一個(gè)節(jié)點(diǎn)最多有多少個(gè)孩子節(jié)點(diǎn),所以描述一顆B樹(shù)時(shí)需要指定它的階數(shù)。

我們?cè)倥e個(gè)例子來(lái)說(shuō)明一下上面的概念,比如這里有一個(gè)5階的B樹(shù),根節(jié)點(diǎn)數(shù)量范圍:1 <= k <= 4,非根節(jié)點(diǎn)數(shù)量范圍:2 <= k <= 4。

下面,我們通過(guò)一個(gè)插入的例子,講解一下B樹(shù)的插入過(guò)程,接著,再講解一下刪除關(guān)鍵字的過(guò)程。

B樹(shù)插入

插入的時(shí)候,我們需要記住一個(gè)規(guī)則:判斷當(dāng)前結(jié)點(diǎn)key的個(gè)數(shù)是否小于等于m-1,如果滿足,直接插入即可,如果不滿足,將節(jié)點(diǎn)的中間的key將這個(gè)節(jié)點(diǎn)分為左右兩部分,中間的節(jié)點(diǎn)放到父節(jié)點(diǎn)中即可。

例子:在5階B樹(shù)中,結(jié)點(diǎn)最多有4個(gè)key,最少有2個(gè)key(注意:下面的節(jié)點(diǎn)統(tǒng)一用一個(gè)節(jié)點(diǎn)表示key和value)。

插入18,70,50,40

插入22

插入22時(shí),發(fā)現(xiàn)這個(gè)節(jié)點(diǎn)的關(guān)鍵字已經(jīng)大于4了,所以需要進(jìn)行分裂,分裂的規(guī)則在上面已經(jīng)講了,分裂之后,如下。

接著插入23,25,39

分裂,得到下面的。

所以B樹(shù)每一層的節(jié)點(diǎn)數(shù)會(huì)變多,相同的數(shù)據(jù)量的話,B樹(shù)會(huì)比二叉樹(shù)高度更低,需要的io次數(shù)就會(huì)變少,所以符合我們的索引需求。那MySQL最后為什么選擇了B+樹(shù)呢,比B樹(shù)更優(yōu)的地方在哪里呢?
我們先看看B+樹(shù)與B樹(shù)不同的地方:

  • B+樹(shù)葉子節(jié)點(diǎn)包含了這棵樹(shù)的所有鍵值,非葉子節(jié)點(diǎn)不存儲(chǔ)數(shù)據(jù),只存儲(chǔ)索引,數(shù)據(jù)都存儲(chǔ)在葉子節(jié)點(diǎn)。而B(niǎo)樹(shù)是每個(gè)節(jié)點(diǎn)都存有索引和數(shù)據(jù)。
  • B+樹(shù)每個(gè)葉子結(jié)點(diǎn)都存有相鄰葉子結(jié)點(diǎn)的指針,葉子結(jié)點(diǎn)本身依關(guān)鍵字的大小自小而大順序鏈接。

如圖:

第一點(diǎn):當(dāng)非葉子節(jié)點(diǎn)只存索引key而不存data時(shí),就可以使得非葉子節(jié)點(diǎn)的占用空間變少,相同容量的節(jié)點(diǎn)可以存儲(chǔ)更多的索引,那同樣是三層的B+樹(shù),階數(shù)就會(huì)變多,就會(huì)比B樹(shù)存更多的數(shù)據(jù)。
第二點(diǎn):B+樹(shù)葉子節(jié)點(diǎn)存有相鄰葉子節(jié)點(diǎn)的指針,想要理解這個(gè)指針的好處,我們的先知道磁盤讀取數(shù)據(jù)時(shí)往往不是嚴(yán)格按需讀取,而是每次都會(huì)預(yù)讀,即使只需要一個(gè)字節(jié),磁盤也會(huì)從這個(gè)位置開(kāi)始,順序向后讀取一定長(zhǎng)度的數(shù)據(jù)放入內(nèi)存。這樣做的理論依據(jù)是計(jì)算機(jī)科學(xué)中著名的局部性原理:

  • 當(dāng)一個(gè)數(shù)據(jù)被用到時(shí),其附近的數(shù)據(jù)也通常會(huì)馬上被使用。
  • 程序運(yùn)行期間所需要的數(shù)據(jù)通常比較集中。

預(yù)讀的長(zhǎng)度一般為頁(yè)(page)的整倍數(shù)。頁(yè)是計(jì)算機(jī)管理存儲(chǔ)器的邏輯塊,硬件及操作系統(tǒng)往往將主存和磁盤存儲(chǔ)區(qū)分割為連續(xù)的大小相等的塊,每個(gè)存儲(chǔ)塊稱為一頁(yè)(在許多操作系統(tǒng)中,頁(yè)得大小通常為4k),主存和磁盤以頁(yè)為單位交換數(shù)據(jù)。當(dāng)程序要讀取的數(shù)據(jù)不在主存中時(shí),會(huì)觸發(fā)一個(gè)缺頁(yè)異常,此時(shí)系統(tǒng)會(huì)向磁盤發(fā)出讀盤信號(hào),磁盤會(huì)找到數(shù)據(jù)的起始位置并向后連續(xù)讀取一頁(yè)或幾頁(yè)載入內(nèi)存中,然后異常返回,程序繼續(xù)運(yùn)行。

現(xiàn)在再看B+樹(shù)葉子節(jié)點(diǎn)的指針,我們就明白了它的用處,預(yù)讀的時(shí)候可以保證連續(xù)讀取的數(shù)據(jù)有序。

可能還有的同學(xué)提過(guò)B*樹(shù),它是在B+樹(shù)基礎(chǔ)上,為非葉子結(jié)點(diǎn)也增加鏈表指針。個(gè)人覺(jué)得沒(méi)用B星樹(shù)可能是覺(jué)得沒(méi)必要吧,我們?cè)诜侨~子節(jié)點(diǎn)又不存data,data都在葉子節(jié)點(diǎn),非葉子節(jié)點(diǎn)了鏈表指針用不上。

一些花里胡哨的概念

聚簇索引和非聚簇索引:上面我們提到B+樹(shù)的葉子節(jié)點(diǎn)存了索引key的數(shù)據(jù)data,但是mysql不同的引擎存data的選擇是不一樣的,MyISAM是將索引文件和真實(shí)的數(shù)據(jù)文件分兩個(gè)文件各種存放,索引文件中存的data是該索引key對(duì)應(yīng)的數(shù)據(jù)在數(shù)據(jù)文件中的地址值,而InnoDB則是將正式的數(shù)據(jù)存在了葉子節(jié)點(diǎn)中。所以聚簇和非聚簇就是區(qū)分葉子節(jié)點(diǎn)存的data是不是真實(shí)的(可以理解為葉子節(jié)點(diǎn)擠不擠?)

回表:回表也簡(jiǎn)單,但是得先明白主鍵索引和普通索引,上面我們所的葉子節(jié)點(diǎn)存真實(shí)的數(shù)據(jù),那是只有主鍵索引才是這么存的,普通索引它存的data是主鍵索引的key。那這樣我們就好理解了。比如我現(xiàn)在給一張表的name字段建了個(gè)普通索引,我想select * from table where name = 'test',這個(gè)時(shí)候我們找到test節(jié)點(diǎn)的時(shí)候,拿到的key只是這行數(shù)據(jù)對(duì)應(yīng)的主鍵key,我們要得到整行的數(shù)據(jù)只能拿著這個(gè)key再去主鍵索引樹(shù)再找一次。這個(gè)操作就叫做回表。

最左匹配原則: 當(dāng)我們新建了一個(gè)組合索引時(shí),比如(name+age),查詢時(shí)使用 where name = xx and age = xx時(shí)會(huì)走組合索引,而where age = xx and name =xx則不會(huì)走。這是因?yàn)镸ySQL創(chuàng)建聯(lián)合索引的規(guī)則是首先會(huì)對(duì)聯(lián)合索引的最左邊第一個(gè)字段排序,在第一個(gè)字段的排序基礎(chǔ)上,然后在對(duì)第二個(gè)字段進(jìn)行排序。

以上就是MySQL使用B+Tree當(dāng)索引有哪些優(yōu)勢(shì)的詳細(xì)內(nèi)容,更多關(guān)于MySQL使用B+Tree當(dāng)索引的優(yōu)勢(shì)的資料請(qǐng)關(guān)注腳本之家其它相關(guān)文章!

相關(guān)文章

  • Shell下實(shí)現(xiàn)免密碼快速登陸MySQL數(shù)據(jù)庫(kù)的方法

    Shell下實(shí)現(xiàn)免密碼快速登陸MySQL數(shù)據(jù)庫(kù)的方法

    這篇文章主要給大家介紹了在Shell下實(shí)現(xiàn)免密碼快速登陸MySQL數(shù)據(jù)庫(kù)的方法,文中通過(guò)示例代碼一步步介紹的非常詳細(xì),對(duì)大家具有一定的參考學(xué)習(xí)價(jià)值,需要的朋友們下面跟著小編來(lái)一起看看吧。
    2017-06-06
  • MySQL如何保證備份數(shù)據(jù)的一致性詳解

    MySQL如何保證備份數(shù)據(jù)的一致性詳解

    在高并發(fā)的場(chǎng)景下,大量的請(qǐng)求直接訪問(wèn)Mysql很容易造成性能問(wèn)題,下面這篇文章主要給大家介紹了關(guān)于MySQL如何保證備份數(shù)據(jù)一致性的相關(guān)資料,文中通過(guò)圖文介紹的非常詳細(xì),需要的朋友可以參考下
    2022-05-05
  • 簡(jiǎn)單了解mysql InnoDB MyISAM相關(guān)區(qū)別

    簡(jiǎn)單了解mysql InnoDB MyISAM相關(guān)區(qū)別

    這篇文章主要介紹了簡(jiǎn)單了解mysql InnoDB MyISAM相關(guān)區(qū)別,文中通過(guò)示例代碼介紹的非常詳細(xì),對(duì)大家的學(xué)習(xí)或者工作具有一定的參考學(xué)習(xí)價(jià)值,需要的朋友可以參考下
    2020-09-09
  • MySQL OOM 系統(tǒng)二 OOM Killer

    MySQL OOM 系統(tǒng)二 OOM Killer

    前面一節(jié)重點(diǎn)分享了Linux的內(nèi)存分配策略,基于上述的分配策略,為了規(guī)避超售的風(fēng)險(xiǎn),Linux采了一種OOM Killer的機(jī)制,即系統(tǒng)可用內(nèi)存(包括Swap)即將使用完之前,選擇性的Kill掉一些進(jìn)程以求釋放一些內(nèi)存
    2016-07-07
  • MySQL 5.7安裝好后打開(kāi)命令行窗口閃退的解決方法

    MySQL 5.7安裝好后打開(kāi)命令行窗口閃退的解決方法

    這篇文章主要給大家介紹了關(guān)于MySQL 5.7安裝好后打開(kāi)命令行窗口閃退的解決方法,文中通過(guò)圖文介紹的非常詳細(xì),對(duì)大家的學(xué)習(xí)或者工作具有一定的參考學(xué)習(xí)價(jià)值,需要的朋友們下面隨著小編來(lái)一起看看吧
    2018-12-12
  • MySQL Innodb表導(dǎo)致死鎖日志情況分析與歸納

    MySQL Innodb表導(dǎo)致死鎖日志情況分析與歸納

    發(fā)現(xiàn)當(dāng)備份表格的sql語(yǔ)句與刪除該表部分?jǐn)?shù)據(jù)的sql語(yǔ)句同時(shí)運(yùn)行時(shí),mysql會(huì)檢測(cè)出死鎖,并打印出日志
    2012-12-12
  • MySQL性能優(yōu)化之Open_Table配置參數(shù)的合理配置建議

    MySQL性能優(yōu)化之Open_Table配置參數(shù)的合理配置建議

    這篇文章主要介紹了MySQL性能優(yōu)化之Open_Table配置參數(shù)的合理配置建議,在MySQL數(shù)據(jù)庫(kù)中,Opened_tables表示打開(kāi)過(guò)的表數(shù)量,需要的朋友可以參考下
    2014-07-07
  • sql四大排名函數(shù)之ROW_NUMBER、RANK、DENSE_RANK、NTILE使用介紹

    sql四大排名函數(shù)之ROW_NUMBER、RANK、DENSE_RANK、NTILE使用介紹

    這篇文章主要介紹了sql四大排名函數(shù)之ROW_NUMBER、RANK、DENSE_RANK、NTILE使用,文中通過(guò)示例代碼介紹的非常詳細(xì),對(duì)大家的學(xué)習(xí)或者工作具有一定的參考學(xué)習(xí)價(jià)值,需要的朋友們下面隨著小編來(lái)一起學(xué)習(xí)學(xué)習(xí)吧
    2020-08-08
  • 解決mysql連接超時(shí)和mysql連接錯(cuò)誤的問(wèn)題

    解決mysql連接超時(shí)和mysql連接錯(cuò)誤的問(wèn)題

    這篇文章主要介紹了解決mysql連接超時(shí)和mysql連接錯(cuò)誤的問(wèn)題,具有很好的參考價(jià)值,希望對(duì)大家有所幫助。如有錯(cuò)誤或未考慮完全的地方,望不吝賜教
    2022-07-07
  • win7下mysql5.7.17安裝配置方法圖文教程

    win7下mysql5.7.17安裝配置方法圖文教程

    這篇文章主要為大家詳細(xì)介紹了win7下mysql5.7.17安裝配置方法圖文教程,具有一定的參考價(jià)值,感興趣的小伙伴們可以參考一下
    2017-03-03

最新評(píng)論