InnoDB的關(guān)鍵特性-插入緩存,兩次寫,自適應(yīng)hash索引詳解
InnoDB存儲(chǔ)引擎的關(guān)鍵特性包括插入緩沖、兩次寫(double write)、自適應(yīng)哈希索引(adaptive hash index)。這些特性為InnoDB存儲(chǔ)引擎帶來了更好的性能和更高的可靠性。
插入緩沖
插入緩沖是InnoDB存儲(chǔ)引擎關(guān)鍵特性中最令人激動(dòng)的。不過,這個(gè)名字可能會(huì)讓人認(rèn)為插入緩沖是緩沖池中的一個(gè)部分。其實(shí)不然,InnoDB緩沖池中有Insert Buffer信息固然不錯(cuò),但是Insert Buffer和數(shù)據(jù)頁一樣,也是物理頁的一個(gè)組成部分。
主鍵是行唯一的標(biāo)識(shí)符,在應(yīng)用程序中行記錄的插入順序是按照主鍵遞增的順序進(jìn)行插入的。因此,插入聚集索引一般是順序的,不需要磁盤的隨機(jī)讀取。
比如說我們按下列SQL定義的表:create table t(id int auto_increment,name varchar(30),primary key(id));
id列是自增長的,這意味著當(dāng)執(zhí)行插入操作時(shí),id列會(huì)自動(dòng)增長,頁中的行記錄按id執(zhí)行順序存放。一般情況下,不需要隨機(jī)讀取另一頁執(zhí)行記錄的存放。因此,在這樣的情況下,插入操作一般很快就能完成。但是,不可能每張表上只有一個(gè)聚集索引,在更多的情況下,一張表上有多個(gè)非聚集的輔助索引(secondary index)。比如,我們還需要按照name這個(gè)字段進(jìn)行查找,并且name這個(gè)字段不是唯一的。
表是按如下的SQL語句定義的:create table t (id int auto_increment,name varchar(30),primary key(id),key(name));
這樣的情況下產(chǎn)生了一個(gè)非聚集的并且不是唯一的索引。在進(jìn)行插入操作時(shí),數(shù)據(jù)頁的存放還是按主鍵id的執(zhí)行順序存放,但是對(duì)于非聚集索引,葉子節(jié)點(diǎn)的插入不再是順序的了。這時(shí)就需要離散地訪問非聚集索引頁,插入性能在這里變低了。然而這并不是這個(gè)name字段上索引的錯(cuò)誤,因?yàn)锽+樹的特性決定了非聚集索引插入的離散性。
InnoDB存儲(chǔ)引擎開創(chuàng)性地設(shè)計(jì)了插入緩沖,對(duì)于非聚集索引的插入或更新操作,不是每一次直接插入索引頁中,而是先判斷插入的非聚集索引頁是否在緩沖池中。如果在,則直接插入;如果不在,則先放入一個(gè)插入緩沖區(qū)中,好似欺騙數(shù)據(jù)庫這個(gè)非聚集的索引已經(jīng)插到葉子節(jié)點(diǎn)了,然后再以一定的頻率執(zhí)行插入緩沖和非聚集索引頁子節(jié)點(diǎn)的合并操作,這時(shí)通常能將多個(gè)插入合并到一個(gè)操作中(因?yàn)樵谝粋€(gè)索引頁中),這就大大提高了對(duì)非聚集索引執(zhí)行插入和修改操作的性能。
插入緩沖的使用需要滿足以下兩個(gè)條件:
1.索引是輔助索引。
2.索引不是唯一的。
當(dāng)滿足以上兩個(gè)條件時(shí),InnoDB存儲(chǔ)引擎會(huì)使用插入緩沖,這樣就能提高性能了。不過考慮一種情況,應(yīng)用程序執(zhí)行大量的插入和更新操作,這些操作都涉及了不唯一的非聚集索引,如果在這個(gè)過程中數(shù)據(jù)庫發(fā)生了宕機(jī),這時(shí)候會(huì)有大量的插入緩沖并沒有合并到實(shí)際的非聚集索引中。如果是這樣,恢復(fù)可能需要很長的時(shí)間,極端情況下甚至需要幾個(gè)小時(shí)來執(zhí)行合并恢復(fù)操作。
輔助索引不能是唯一的,因?yàn)樵诎阉迦氲讲迦刖彌_時(shí),我們并不去查找索引頁的情況。如果去查找肯定又會(huì)出現(xiàn)離散讀的情況,插入緩沖就失去了意義。
查看插入緩沖的信息:
show engine innodb status\G
seg size顯示了當(dāng)前插入緩沖的大小為2*16KB,free list len代表了空閑列表的長度,size代表了已經(jīng)合并記錄頁的數(shù)量。
下面一行可能是我們真正關(guān)心的,因?yàn)樗@示了提高性能了。inserts代表插入的記錄數(shù),merged recs代表合并的頁的數(shù)量,merges代表合并的次數(shù)。
merged recs:merges大約為3:1,代表插入緩沖將對(duì)于非聚集索引頁的IO請(qǐng)求大約降低了3倍。
問題:
目前插入緩沖存在一個(gè)問題是,在寫密集的情況下,插入緩沖會(huì)占用過多的緩沖池內(nèi)存,默認(rèn)情況下最大可以占用1/2的緩沖池內(nèi)存。Percona已發(fā)布一些patch來修正插入緩沖占用太多緩沖池內(nèi)存的問題,具體的可以到http://www.percona.com/percona-lab.html查找。簡單來說,修改IBUF_POOL_SIZE_PER_MAX_SIZE就可以對(duì)插入緩沖的大小進(jìn)行控制,例如,將IBUF_POOL_SIZE_PER_MAX_SIZE改為3,則最大只能使用1/3的緩沖池內(nèi)存。
兩次寫
如果說插入緩沖帶給InnoDB存儲(chǔ)引擎的是性能,那么兩次寫帶給InnoDB存儲(chǔ)引擎的是數(shù)據(jù)的可靠性。當(dāng)數(shù)據(jù)庫宕機(jī)時(shí),可能發(fā)生數(shù)據(jù)庫正在寫一個(gè)頁面,而這個(gè)頁只寫了一部分(比如16K的頁,只寫前4K的頁)的情況,我們稱之為部分寫失效(partial page write)。在InnoDB存儲(chǔ)引擎未使用double write技術(shù)前,曾出現(xiàn)過因?yàn)椴糠謱懯Ф鴮?dǎo)致數(shù)據(jù)丟失的情況。
有人也許會(huì)想,如果發(fā)生寫失效,可以通過重做日志進(jìn)行恢復(fù)。這是一個(gè)辦法。但是必須清楚的是,重做日志中記錄的是對(duì)頁的物理操作,如偏移量800,寫'aaaa'記錄。如果這個(gè)頁本身已經(jīng)損壞,再對(duì)其進(jìn)行重做是沒有意義的。這就是說,在應(yīng)用(apply)重做日志前,我們需要一個(gè)頁的副本,當(dāng)寫入失效發(fā)生時(shí),先通過頁的副本來還原該頁,再進(jìn)行重做,這就是doublewrite。
InnoDB存儲(chǔ)引擎doublewrite的體系架構(gòu)如圖2-4所示
doublewrite由兩部分組成:一部分是內(nèi)存中的doublewrite buffer,大小為2MB;另一部分是物理磁盤上共享表空間中連續(xù)的128個(gè)頁,即兩個(gè)區(qū)(extent),大小同樣為2MB(頁的副本)。當(dāng)緩沖池的臟頁刷新時(shí),并不直接寫磁盤,而是會(huì)通過memcpy函數(shù)將臟頁先拷貝到內(nèi)存中的doublewrite buffer,之后通過doublewrite buffer再分兩次,每次寫入1MB到共享表空間的物理磁盤上,然后馬上調(diào)用fsync函數(shù),同步磁盤,避免緩沖寫帶來的問題。在這個(gè)過程中,因?yàn)閐oublewrite頁是連續(xù)的,因此這個(gè)過程是順序?qū)懙模_銷并不是很大。在完成doublewrite頁的寫入后,再將doublewrite buffer中的頁寫入各個(gè)表空間文件中,此時(shí)的寫入則是離散的。
可以通過以下命令觀察到doublewrite運(yùn)行的情況: show global status like 'innodb_dblwr%'\G
doublewrite一共寫了18 445個(gè)頁,但實(shí)際的寫入次數(shù)為434,(42:1) 基本上符合64:1。
如果發(fā)現(xiàn)你的系統(tǒng)在高峰時(shí)Innodb_dblwr_pages_written:Innodb_dblwr_writes遠(yuǎn)小于64:1,那么說明你的系統(tǒng)寫入壓力并不是很高。
如果操作系統(tǒng)在將頁寫入磁盤的過程中崩潰了,在恢復(fù)過程中,InnoDB存儲(chǔ)引擎可以從共享表空間中的doublewrite中找到改頁的一個(gè)副本,將其拷貝到表空間文件,再應(yīng)用重做日志。下面顯示了由doublewrite進(jìn)行恢復(fù)的一種情況:
090924 11:36:32 mysqld restarted 090924 11:36:33 InnoDB:Database was not shut down normally! InnoDB:Starting crash recovery. InnoDB:Reading tablespace information from the.ibd files…… InnoDB:Error:space id in fsp header 0,but in the page header 4294967295 InnoDB:Error:tablespace id 4294967295 in file./test/t.ibd is not sensible InnoDB:Error:tablespace id 0 in file./test/t2.ibd is not sensible 090924 11:36:33 InnoDB:Operating system error number 40 in a file operation. InnoDB:Error number 40 means'Too many levels of symbolic links'. InnoDB:Some operating system error numbers are described at InnoDB:http://dev.mysql.com/doc/refman/5.0/en/operating-system-error-codes.html InnoDB:File name./now/member InnoDB:File operation call:'stat'. InnoDB:Error:os_file_readdir_next_file()returned-1 in InnoDB:directory./now InnoDB:Crash recovery may have failed for some.ibd files! InnoDB:Restoring possible half-written data pages from the doublewrite InnoDB:buffer……
參數(shù)skip_innodb_doublewrite可以禁止使用兩次寫功能,這時(shí)可能會(huì)發(fā)生前面提及的寫失效問題。不過,如果你有多臺(tái)從服務(wù)器(slave server),需要提供較快的性能(如slave上做的是RAID0),也許啟用這個(gè)參數(shù)是一個(gè)辦法。不過,在需要提供數(shù)據(jù)高可靠性的主服務(wù)器(master server)上,任何時(shí)候我們都應(yīng)確保開啟兩次寫功能。
注意:有些文件系統(tǒng)本身就提供了部分寫失效的防范機(jī)制,如ZFS文件系統(tǒng)。在這種情況下,我們就不要啟用doublewrite了。
自適應(yīng)哈希索引
哈希(hash)是一種非??斓牟檎曳椒?,一般情況下查找的時(shí)間復(fù)雜度為O(1)。常用于連接(join)操作,如SQL Server和Oracle中的哈希連接(hash join)。但是SQL Server和Oracle等常見的數(shù)據(jù)庫并不支持哈希索引(hash index)。MySQL的Heap存儲(chǔ)引擎默認(rèn)的索引類型為哈希,而InnoDB存儲(chǔ)引擎提出了另一種實(shí)現(xiàn)方法,自適應(yīng)哈希索引(adaptive hash index)。
InnoDB存儲(chǔ)引擎會(huì)監(jiān)控對(duì)表上索引的查找,如果觀察到建立哈希索引可以帶來速度的提升,則建立哈希索引,所以稱之為自適應(yīng)(adaptive)的。自適應(yīng)哈希索引通過緩沖池的B+樹構(gòu)造而來,因此建立的速度很快。而且不需要將整個(gè)表都建哈希索引,InnoDB存儲(chǔ)引擎會(huì)自動(dòng)根據(jù)訪問的頻率和模式來為某些頁建立哈希索引。
根據(jù)InnoDB的官方文檔顯示,啟用自適應(yīng)哈希索引后,讀取和寫入速度可以提高2倍;對(duì)于輔助索引的連接操作,性能可以提高5倍。自適應(yīng)哈希索引是非常好的優(yōu)化模式,其設(shè)計(jì)思想是數(shù)據(jù)庫自優(yōu)化(self-tuning),即無需DBA對(duì)數(shù)據(jù)庫進(jìn)行調(diào)整。
查看當(dāng)前自適應(yīng)哈希索引的使用狀況:show engine innodb status\G
現(xiàn)在可以看到自適應(yīng)哈希索引的使用信息了,包括自適應(yīng)哈希索引的大小、使用情況、每秒使用自適應(yīng)哈希索引搜索的情況。值得注意的是,哈希索引只能用來搜索等值的查詢,如select * from table where index_col='xxx',而對(duì)于其他查找類型,如范圍查找,是不能使用的。因此,這里出現(xiàn)了non-hash searches/s的情況。用hash searches:non-hash searches命令可以大概了解使用哈希索引后的效率。
由于自適應(yīng)哈希索引是由InnoDB存儲(chǔ)引擎控制的,所以這里的信息只供我們參考。不過我們可以通過參數(shù)innodb_adaptive_hash_index來禁用或啟動(dòng)此特性,默認(rèn)為開啟。
以上這篇InnoDB的關(guān)鍵特性-插入緩存,兩次寫,自適應(yīng)hash索引詳解就是小編分享給大家的全部內(nèi)容了,希望能給大家一個(gè)參考,也希望大家多多支持腳本之家。
相關(guān)文章
MySQL數(shù)據(jù)分析存儲(chǔ)引擎示例講解
這篇文章主要為大家介紹了MySQL數(shù)據(jù)分析關(guān)于存儲(chǔ)引擎的示例講解,搞懂存儲(chǔ)引擎會(huì)對(duì)大家在數(shù)據(jù)分析方面有很大的幫助,有需要的朋友可以借鑒參考下2021-10-10MySQL OOM 系列三 擺脫MySQL被Kill的厄運(yùn)
這篇文章主要介紹了MySQL OOM 系列三 擺脫MySQL被Kill的厄運(yùn) ,需要的朋友可以參考下2016-07-07解決數(shù)據(jù)庫有數(shù)據(jù)但查詢出來的值為Null問題
這篇文章主要介紹了解決數(shù)據(jù)庫有數(shù)據(jù)但查詢出來的值為Null問題,具有很好的參考價(jià)值,希望對(duì)大家有所幫助,如有錯(cuò)誤或未考慮完全的地方,望不吝賜教2023-10-10MySQL基于SSL協(xié)議進(jìn)行主從復(fù)制的詳細(xì)操作教程
這篇文章主要介紹了MySQL基于SSL協(xié)議進(jìn)行主從復(fù)制的詳細(xì)操作教程,示例環(huán)境基于Linux系統(tǒng)以及OpenSSL客戶端,需要的朋友可以參考下2015-12-12Linux環(huán)境下設(shè)置MySQL表名忽略大小寫的方法小結(jié)
在MySQL中,表名的大小寫敏感性取決于操作系統(tǒng)和MySQL的配置,在Unix/Linux系統(tǒng)上,表名通常是區(qū)分大小寫的,由于之前MySQL未設(shè)置忽略表名大小寫導(dǎo)致數(shù)據(jù)查詢失敗等問題,所以本文給大家介紹了Linux環(huán)境下設(shè)置MySQL表名忽略大小寫的方法,需要的朋友可以參考下2024-06-06