怎樣正確創(chuàng)建MySQL索引的方法詳解
索引類似大學(xué)圖書(shū)館建書(shū)目索引,可以提高數(shù)據(jù)檢索的效率,降低數(shù)據(jù)庫(kù)的IO成本。MySQL在300萬(wàn)條記錄左右性能開(kāi)始逐漸下降,雖然官方文檔說(shuō)500~800w記錄,所以大數(shù)據(jù)量建立索引是非常有必要的。MySQL提供了Explain,用于顯示SQL執(zhí)行的詳細(xì)信息,可以進(jìn)行索引的優(yōu)化。
什么是索引?
MySQL官方對(duì)索引的定義為:索引(Index)是幫助MySQL高效獲取數(shù)據(jù)的數(shù)據(jù)結(jié)構(gòu)。我們可以簡(jiǎn)單理解為:快速查找排好序的一種數(shù)據(jù)結(jié)構(gòu)。Mysql索引主要有兩種結(jié)構(gòu):B+Tree索引和Hash索引。我們平常所說(shuō)的索引,如果沒(méi)有特別指明,一般都是指B樹(shù)結(jié)構(gòu)組織的索引(B+Tree索引)。索引如圖所示:
最外層淺藍(lán)色磁盤(pán)塊1里有數(shù)據(jù)17、35(深藍(lán)色)和指針P1、P2、P3(黃色)。P1指針表示小于17的磁盤(pán)塊,P2是在17-35之間,P3指向大于35的磁盤(pán)塊。真實(shí)數(shù)據(jù)存在于子葉節(jié)點(diǎn)也就是最底下的一層3、5、9、10、13……非葉子節(jié)點(diǎn)不存儲(chǔ)真實(shí)的數(shù)據(jù),只存儲(chǔ)指引搜索方向的數(shù)據(jù)項(xiàng),如17、35。
查找過(guò)程:例如搜索28數(shù)據(jù)項(xiàng),首先加載磁盤(pán)塊1到內(nèi)存中,發(fā)生一次I/O,用二分查找確定在P2指針。接著發(fā)現(xiàn)28在26和30之間,通過(guò)P2指針的地址加載磁盤(pán)塊3到內(nèi)存,發(fā)生第二次I/O。用同樣的方式找到磁盤(pán)塊8,發(fā)生第三次I/O。
真實(shí)的情況是,上面3層的B+Tree可以表示上百萬(wàn)的數(shù)據(jù),上百萬(wàn)的數(shù)據(jù)只發(fā)生了三次I/O而不是上百萬(wàn)次I/O,時(shí)間提升是巨大的。
數(shù)據(jù)表索引可以提高數(shù)據(jù)的檢索效率,也可以降低數(shù)據(jù)庫(kù)的IO成本,并且索引還可以降低數(shù)據(jù)庫(kù)的排序成本。排序分組操作主要消耗的就是CPU資源和內(nèi)存,所以能夠在排序分組操作中好好的利用索引將會(huì)極大地降低CPU資源的消耗。下面我們將簡(jiǎn)單的分析一下怎樣正確創(chuàng)建MySQL數(shù)據(jù)索引。
怎樣判斷是否需要?jiǎng)?chuàng)建索引?
1、某些字段需要頻繁用作查詢條件時(shí)需要為它建立索引
這個(gè)應(yīng)該都知道,什么樣才是頻繁呢?綜合分析你執(zhí)行的所有SQL語(yǔ)句。最好將他們一個(gè)個(gè)都列出來(lái)。然后分析,發(fā)現(xiàn)其中有些字段在大部分的SQL語(yǔ)句查詢時(shí)候都會(huì)用到,那么就果斷為他建立索引。
2、唯一性太差的字段不適合建立索引
什么是唯一性太差的字段?如狀態(tài)字段、類型字段。那些只存儲(chǔ)固定幾個(gè)值的字段,例如用戶登錄狀態(tài)、消息的status等。這個(gè)涉及到了索引掃描的特性。例如:通過(guò)索引查找鍵值為A和B的某些數(shù)據(jù),通過(guò)A找到某條相符合的數(shù)據(jù),這條數(shù)據(jù)在X頁(yè)上面,然后繼續(xù)掃描,又發(fā)現(xiàn)符合A的數(shù)據(jù)出現(xiàn)在了Y頁(yè)上面,那么存儲(chǔ)引擎就會(huì)丟棄X頁(yè)面的數(shù)據(jù),然后存儲(chǔ)Y頁(yè)面上的數(shù)據(jù),一直到查找完所有對(duì)應(yīng)A的數(shù)據(jù),然后查找B字段,發(fā)現(xiàn)X頁(yè)面上面又有對(duì)應(yīng)B字段的數(shù)據(jù),那么他就會(huì)再次掃描X頁(yè)面,等于X頁(yè)面就會(huì)被掃描2次甚至多次。以此類推,所以同一個(gè)數(shù)據(jù)頁(yè)可能會(huì)被多次重復(fù)的讀取,丟棄,在讀取,這無(wú)疑給存儲(chǔ)引擎極大地增加了IO的負(fù)擔(dān)。
3、更新太頻繁地字段不適合創(chuàng)建索引
當(dāng)你為某個(gè)字段創(chuàng)建索引時(shí)候,如果再次更新這個(gè)字段數(shù)據(jù)時(shí),數(shù)據(jù)庫(kù)就會(huì)自動(dòng)更新他的索引,所以當(dāng)這個(gè)字段更新太頻繁地時(shí)候那么就會(huì)不斷的更新索引,性能的影響可想而知。大概被檢索幾十次才會(huì)更新一次的字段才比較符合建立索引的規(guī)范。而如果一個(gè)字段同一個(gè)時(shí)間段內(nèi)被更新多次,那么果斷不能為他建立索引。
4、不會(huì)出現(xiàn)在where條件中的字段不該建立索引
這個(gè)其實(shí)沒(méi)什么好說(shuō)的,不會(huì)用作查詢條件的字段建立了索引也沒(méi)用。
總結(jié)
以上就是這篇文章的全部?jī)?nèi)容了,希望本文的內(nèi)容對(duì)大家的學(xué)習(xí)或者工作具有一定的參考學(xué)習(xí)價(jià)值,謝謝大家對(duì)腳本之家的支持。如果你想了解更多相關(guān)內(nèi)容請(qǐng)查看下面相關(guān)鏈接
相關(guān)文章
解決MySQL錯(cuò)誤碼:1054 Unknown column ‘**‘ in&n
這篇文章主要介紹了解決MySQL錯(cuò)誤碼:1054 Unknown column ‘**‘ in ‘field list‘的問(wèn)題,具有很好的參考價(jià)值,希望對(duì)大家有所幫助,如有錯(cuò)誤或未考慮完全的地方,望不吝賜教2024-05-05SQL實(shí)現(xiàn)LeetCode(185.系里前三高薪水)
這篇文章主要介紹了SQL實(shí)現(xiàn)LeetCode(185.系里前三高薪水),本篇文章通過(guò)簡(jiǎn)要的案例,講解了該項(xiàng)技術(shù)的了解與使用,以下就是詳細(xì)內(nèi)容,需要的朋友可以參考下2021-08-08Win10環(huán)境下安裝Mysql5.7.23問(wèn)題及遇到的坑
這篇文章主要介紹了Win10環(huán)境下安裝Mysql5.7.23問(wèn)題及遇到的坑,本文通過(guò)圖文并茂的形式給大家介紹的非常詳細(xì),具有一定的參考借鑒價(jià)值,需要的朋友可以參考下2019-11-11解決mysql與navicat建立連接出現(xiàn)1251錯(cuò)誤
在本篇文章里小編給大家整理了一篇關(guān)于mysql與navicat建立連接出現(xiàn)1251錯(cuò)誤怎么解決的技術(shù)文章,需要的朋友們參考下。2019-08-08草稿整理后mysql兩個(gè)數(shù)據(jù)庫(kù)結(jié)構(gòu)對(duì)比
這篇文章主要為大家詳細(xì)介紹了mysql兩個(gè)數(shù)據(jù)庫(kù)結(jié)構(gòu)對(duì)比結(jié)果,文中示例代碼介紹的非常詳細(xì),具有一定的參考價(jià)值,感興趣的小伙伴們可以參考一下,希望能夠給你帶來(lái)幫助2022-02-02MySql 字符串中提取數(shù)字的實(shí)現(xiàn)示例
在MySQL中,有時(shí)需要從字符串中提取數(shù)字,本文就來(lái)介紹一下MySql 字符串中提取數(shù)字的實(shí)現(xiàn)示例,具有一定的參考價(jià)值,感興趣的可以了解一下2023-09-09