一篇文章帶你了解MySQL之undo日志

更新時(shí)間：2023年06月05日 10:06:28 作者：multis

Undo日志也叫做回滾日志,是MySQL數(shù)據(jù)庫(kù)當(dāng)中一種重要的日志,用于記錄更新操作之前的數(shù)據(jù)狀態(tài),這篇文章主要給大家介紹了關(guān)于如何通過一篇文章帶你了解MySQL之undo日志的相關(guān)資料,需要的朋友可以參考下

一、事務(wù)回滾的需求

我們?cè)谇斑厡W(xué)習(xí)事務(wù)的時(shí)候說過事務(wù)需要保證原子性，也就是事務(wù)中的操作要么全做，要么全不做。但是有的時(shí)候事務(wù)會(huì)出現(xiàn)一些情況，比如：

情況一：事務(wù)執(zhí)行過程中可能遇到各種錯(cuò)誤，比如服務(wù)器本身的錯(cuò)誤，操作系統(tǒng)錯(cuò)誤，甚至是突然斷電導(dǎo)致的錯(cuò)誤
情況二：程序員可以在事務(wù)執(zhí)行過程中手動(dòng)輸入ROLLBACK語(yǔ)句結(jié)束當(dāng)前的事務(wù)的執(zhí)行

以上這兩種情況都會(huì)導(dǎo)致事務(wù)執(zhí)行到一半就結(jié)束，但是事務(wù)執(zhí)行過程中可能已經(jīng)修改了很多東西，為了保證事務(wù)的原子性，我們需要把東西改回原先的樣子，這個(gè)過程就稱之為回滾（英文名：rollback），這樣就可以造成一個(gè)假象：這個(gè)事務(wù)看起來什么都沒做，所以符合原子性要求。

好比小時(shí)候我們和小伙伴們完紙牌?；谂凭褪且环N非常典型的回滾操作，比如你出兩張三紙牌，悔牌對(duì)應(yīng)的操作就是把兩張三紙牌在拿出去。數(shù)據(jù)庫(kù)中的回滾跟悔牌差不多，你插入了一條記錄，回滾操作對(duì)應(yīng)的就是把這條記錄刪除掉；你更新了一條記錄，回滾操作對(duì)應(yīng)的就是把該記錄更新為舊值；你刪除了一條記錄，回滾操作對(duì)應(yīng)的自然就是把該記錄再插進(jìn)去。說的貌似很簡(jiǎn)單的樣子

從上邊的描述中我們已經(jīng)能隱約感覺到，每當(dāng)我們要對(duì)一條記錄做改動(dòng)時(shí)（這里的改動(dòng)可以指INSERT、DELETE、UPDATE），都需要留一手 —— 把回滾時(shí)所需的東西都給記下來。比如說：

你插入一條記錄時(shí)，至少要把這條記錄的主鍵值記下來，之后回滾的時(shí)候只需要把這個(gè)主鍵值對(duì)應(yīng)的記錄刪掉就好了
你刪除了一條記錄，至少要把這條記錄中的內(nèi)容都記下來，這樣之后回滾時(shí)再把由這些內(nèi)容組成的記錄插入到表中就好了
你修改了一條記錄，至少要把修改這條記錄前的舊值都記錄下來，這樣之后回滾時(shí)再把這條記錄更新為舊值就好了

數(shù)據(jù)庫(kù)這些為了回滾?記錄的這些東東稱之為撤銷日志，英文名為undo log，我們稱之為undo日志。這里需要注意的一點(diǎn)是，由于查詢操作（SELECT）并不會(huì)修改任何?戶記錄，所以在查詢操作執(zhí)行時(shí)，并不需要記錄相應(yīng)的undo日志。在真實(shí)的InnoDB中，undo日志其實(shí)并不像我們上邊所說的那么簡(jiǎn)單，不同類型的操作產(chǎn)?的undo日志的格式也是不同的，不過先暫時(shí)把這些容易讓人腦子糊的具體細(xì)節(jié)放一放，我們先回過頭來看看事務(wù)id是什么東西

二、事務(wù)id

2.1 給事務(wù)分配id的時(shí)機(jī)

我們前邊在學(xué)習(xí)事務(wù)簡(jiǎn)介時(shí)說過，一個(gè)事務(wù)可以是一個(gè)只讀事務(wù)，或者是一個(gè)讀寫事務(wù)：

我們可以通過START TRANSACTION READ ONLY語(yǔ)句開啟一個(gè)只讀事務(wù)，在只讀事務(wù)中不可以對(duì)普通的表（其他事務(wù)也能訪問到的表）進(jìn)行增、刪、改操作，但可以對(duì)臨時(shí)表做增、刪、改操作我們可以通過START TRANSACTION READ WRITE語(yǔ)句開啟一個(gè)讀寫事務(wù)，或者使用BEGIN、START TRANSACTION語(yǔ)句開啟的事務(wù)默認(rèn)也算是讀寫事務(wù)，在讀寫事務(wù)中可以對(duì)表執(zhí)行增刪改查操作。

如果某個(gè)事務(wù)執(zhí)行過程中對(duì)某個(gè)表執(zhí)行了增、刪、改操作，那么InnoDB存儲(chǔ)引擎就會(huì)給它分配一個(gè)獨(dú)一無二的事務(wù)id，分配如式如下：

對(duì)于只讀事務(wù)來說，只有在它第一次對(duì)某個(gè)用戶創(chuàng)建的臨時(shí)表執(zhí)行增、刪、改操作時(shí)才會(huì)為這個(gè)事務(wù)分配一個(gè)事務(wù)id，否則的話是不分配事務(wù)id的

小提示：
我們前邊說過對(duì)某個(gè)查詢語(yǔ)句執(zhí)行EXPLAIN分析它的查詢計(jì)劃時(shí)，有時(shí)候在Extra列會(huì)看到Using temporary的提示，這個(gè)表明在執(zhí)行該查詢語(yǔ)句時(shí)會(huì)用到內(nèi)部臨時(shí)表。這個(gè)所謂的內(nèi)部臨時(shí)表和我們手動(dòng)用CREATE TEMPORARY TABLE創(chuàng)建的用戶臨時(shí)表并不一樣，在事務(wù)回滾時(shí)并不需要把執(zhí)行SELECT語(yǔ)句過程中用到的內(nèi)部臨時(shí)表也回滾，在執(zhí)行SELECT語(yǔ)句用到內(nèi)部臨時(shí)表時(shí)并不會(huì)為它分配事務(wù)id。

對(duì)于讀寫事務(wù)來說，只有在它第一次對(duì)某個(gè)表（包括用戶創(chuàng)建的臨時(shí)表）執(zhí)行增、刪、改操作時(shí)才會(huì)為這個(gè)事務(wù)分配一個(gè)事務(wù)id，否則的話也是不分配事務(wù)id的

有的時(shí)候雖然我們開啟了一個(gè)讀寫事務(wù)，但是在這個(gè)事務(wù)中全是查詢語(yǔ)句，并沒有執(zhí)行增、刪、改的語(yǔ)句，那也就意味著這個(gè)事務(wù)并不會(huì)被分配一個(gè)事務(wù)id

說了半天，事務(wù)id有啥子用？這個(gè)先保密哈，后邊會(huì)一步步的詳細(xì)嘮叨?，F(xiàn)在只要知道只有在事務(wù)對(duì)表中的記錄做改動(dòng)時(shí)才會(huì)為這個(gè)事務(wù)分配一個(gè)唯一的事務(wù)id。

2.2 事務(wù)id是怎么生成的

這個(gè)事務(wù)id本質(zhì)上就是一個(gè)數(shù)字，它的分配策略和我們前邊提到的對(duì)隱藏列row_id（當(dāng)用戶沒有為表創(chuàng)建主鍵和UNIQUE鍵時(shí)InnoDB自動(dòng)創(chuàng)建的列）的分配策略大抵相同，具體策略如下：

服務(wù)器會(huì)在內(nèi)存中維護(hù)一個(gè)全局變量，每當(dāng)需要為某個(gè)事務(wù)分配一個(gè)事務(wù)id時(shí)，就會(huì)把該變量的值當(dāng)作事務(wù)id分配給該事務(wù)，并且把該變量自增1
每當(dāng)這個(gè)變量的值為256的倍數(shù)時(shí)，就會(huì)將該變量的值刷新到系統(tǒng)表空間的?號(hào)為5的??中一個(gè)稱之為Max Trx ID的屬性處，這個(gè)屬性占用8個(gè)字節(jié)的存儲(chǔ)空間
當(dāng)系統(tǒng)下一次重新啟動(dòng)時(shí)，會(huì)將上邊提到的Max Trx ID屬性加載到內(nèi)存中，將該值加上256之后賦值給我們前邊提到的全局變量（因?yàn)樵谏洗侮P(guān)機(jī)時(shí)該全局變
量的值可能大于Max Trx ID屬性值）

這樣就可以保證整個(gè)系統(tǒng)中分配的事務(wù)id值是一個(gè)遞增的數(shù)字。先被分配id的事務(wù)得到的是較小的事務(wù)id，后被分配id的事務(wù)得到的是較大的事務(wù)id。

2.3 trx_id隱藏列

我們前邊學(xué)習(xí)InnoDB記錄行格式的時(shí)候重點(diǎn)強(qiáng)調(diào)過：聚簇索引的記錄除了會(huì)保存完整的用戶數(shù)據(jù)以外，而且還會(huì)自動(dòng)添加名為trx_id、roll_pointer的隱藏列，如果用戶沒有在表中定義主鍵以及UNIQUE鍵，還會(huì)自動(dòng)添加一個(gè)名為row_id的隱藏列。所以一條記錄在頁(yè)面中的真實(shí)結(jié)構(gòu)看起來就是這樣的：

其中的trx_id列其實(shí)還蠻好理解的，就是某個(gè)對(duì)這個(gè)聚簇索引記錄做改動(dòng)的語(yǔ)句所在的事務(wù)對(duì)應(yīng)的事務(wù)id而已（此處的改動(dòng)可以是INSERT、DELETE、UPDATE操作）。至于roll_pointer隱藏列我們后邊分析～

三、undo日志的格式

為了實(shí)現(xiàn)事務(wù)的原子性，InnoDB存儲(chǔ)引擎在實(shí)際進(jìn)行增、刪、改一條記錄時(shí)，都需要先把對(duì)應(yīng)的undo日志記下來。一般每對(duì)一條記錄做一次改動(dòng)，就對(duì)應(yīng)著一條undo日志，但在某些更新記錄的操作中，也可能會(huì)對(duì)應(yīng)著2條undo日志，這個(gè)我們后邊會(huì)仔細(xì)嘮叨。一個(gè)事務(wù)在執(zhí)行過程中可能新增、刪除、更新若干條記錄，也就是說需要記錄很多條對(duì)應(yīng)的undo日志，這些undo日志會(huì)被從0開始編號(hào)，也就是說根據(jù)生成的順序分別被稱為第0號(hào)undo日志、第1號(hào)undo日志、…、第n號(hào)undo日志等，這個(gè)編號(hào)也被稱之為undo no。

這些undo日志是被記錄到類型為FIL_PAGE_UNDO_LOG（對(duì)應(yīng)的十六進(jìn)制是0x0002，忘記了頁(yè)面類型是個(gè)啥的同學(xué)需要回過頭再看看前邊的章節(jié)）的頁(yè)面中。這些頁(yè)面可以從系統(tǒng)表空間中分配，也可以從一種專門存放undo日志的表空間，也就是所謂的undo tablespace中分配。不過關(guān)于如何分配存儲(chǔ)undo日志的頁(yè)面這個(gè)事情我們稍后再說，現(xiàn)在先來看看不同操作都會(huì)產(chǎn)生什么樣子的undo日志吧～為了故事的順利發(fā)展，我們先來創(chuàng)建一個(gè)名為demo18的表：

mysql> CREATE TABLE demo18 (
    id INT NOT NULL,
    key1 VARCHAR(100),
    col VARCHAR(100),
    PRIMARY KEY (id),
    KEY idx_key1 (key1)
    )Engine=InnoDB CHARSET=utf8;
Query OK, 0 rows affected, 1 warning (0.06 sec)

這個(gè)表中有3個(gè)列，其中id列是主鍵，我們?yōu)?code>key1列建立了一個(gè)二級(jí)索引，col列是一個(gè)普通的列。我們前邊介紹InnoDB的數(shù)據(jù)字典時(shí)說過，每個(gè)表都會(huì)被分配一個(gè)唯一的table id，我們可以通過系統(tǒng)數(shù)據(jù)庫(kù)information_schema中的innodb_tables表來查看某個(gè)表對(duì)應(yīng)的table id是什么，現(xiàn)在我們查看一下demo18對(duì)應(yīng)的table id是多少：

mysql> SELECT * FROM information_schema.innodb_tables WHERE name = 'testdb/demo18';
+----------+---------------+------+--------+-------+------------+---------------+------------+--------------+--------------------+
| TABLE_ID | NAME          | FLAG | N_COLS | SPACE | ROW_FORMAT | ZIP_PAGE_SIZE | SPACE_TYPE | INSTANT_COLS | TOTAL_ROW_VERSIONS |
+----------+---------------+------+--------+-------+------------+---------------+------------+--------------+--------------------+
|     1128 | testdb/demo18 |   33 |      6 |    66 | Dynamic    |             0 | Single     |            0 |                  0 |
+----------+---------------+------+--------+-------+------------+---------------+------------+--------------+--------------------+
1 row in set (0.00 sec)

從查詢結(jié)果可以看出，demo18表對(duì)應(yīng)的table id為1128，先把這個(gè)值記住，我們后邊有用

3.1 INSERT操作對(duì)應(yīng)的undo日志

我們前邊說過，當(dāng)我們向表中插入一條記錄時(shí)會(huì)有樂觀插入和悲觀插入的區(qū)分，但是不管怎么插入，最終導(dǎo)致的結(jié)果就是這條記錄被放到了一個(gè)數(shù)據(jù)頁(yè)中。如果希望回滾這個(gè)插入操作，那么把這條記錄刪除就好了，也就是說在寫對(duì)應(yīng)的undo日志時(shí)，主要是把這條記錄的主鍵信息記上。所以InnoDB設(shè)計(jì)了一個(gè)類型為TRX_UNDO_INSERT_REC的undo日志，它的完整結(jié)構(gòu)如下圖所示：

根據(jù)示意圖我們強(qiáng)調(diào)幾點(diǎn)：

undo no在一個(gè)事務(wù)中是從0開始遞增的，也就是說只要事務(wù)沒提交，每生成一條undo日志，那么該條日志的undo no就增1。

如果記錄中的主鍵只包含一個(gè)列，那么在類型為TRX_UNDO_INSERT_REC的undo日志中只需要把該列占用的存儲(chǔ)空間大小和真實(shí)值記錄下來，如果記錄中的主鍵包含多個(gè)列，那么每個(gè)列占用的存儲(chǔ)空間大小和對(duì)應(yīng)的真實(shí)值都需要記錄下來（圖中的len就代表列占用的存儲(chǔ)空間大小，value就代表列的真實(shí)值）。

小提示：
當(dāng)我們向某個(gè)表中插入一條記錄時(shí)，實(shí)際上需要向聚簇索引和所有的二級(jí)索引都插入一條記錄。不過記錄undo日志時(shí)，我們只需要考慮向聚簇索引插入記錄時(shí)的情況就好了，因?yàn)槠鋵?shí)聚簇索引記錄和二級(jí)索引記錄是一一對(duì)應(yīng)的，我們?cè)诨貪L插入操作時(shí)，只需要知道這條記
錄的主鍵信息，然后根據(jù)主鍵信息做對(duì)應(yīng)的刪除操作，做刪除操作時(shí)就會(huì)順帶著把所有二級(jí)索引中相應(yīng)的記錄也刪除掉。后邊說到的DELETE操作和UPDATE操作對(duì)應(yīng)的undo日志也都是針對(duì)聚簇索引記錄而?的，我們之后就不強(qiáng)調(diào)了。

現(xiàn)在我們向demo18中插入兩條記錄：

mysql> BEGIN;  # 顯式開啟一個(gè)事務(wù)，假設(shè)該事務(wù)的id為100
Query OK, 0 rows affected (0.00 sec)
mysql> # 插入兩條記錄
mysql> INSERT INTO demo18(id, key1, col) VALUES (1, 'AWM', '狙擊槍'), (2, 'M416', '步槍');
Query OK, 2 rows affected (0.01 sec)
Records: 2  Duplicates: 0  Warnings: 0

因?yàn)橛涗浀闹麈I只包含一個(gè)id列，所以我們?cè)趯?duì)應(yīng)的undo日志中只需要將待插入記錄的id列占用的存儲(chǔ)空間長(zhǎng)度（id列的類型為INT，INT類型占用的存儲(chǔ)空間長(zhǎng)度為4個(gè)字節(jié)）和真實(shí)值記錄下來。本例中插入了兩條記錄，所以會(huì)產(chǎn)生兩條類型為TRX_UNDO_INSERT_REC的undo日志:

第一條undo日志的undo no為0，記錄主鍵占用的存儲(chǔ)空間長(zhǎng)度為4，真實(shí)值為1。畫一個(gè)示意圖就是這樣：

第二條undo日志的undo no為1，記錄主鍵占用的存儲(chǔ)空間長(zhǎng)度為4，真實(shí)值為2。畫一個(gè)示意圖就是這樣：

與第一條undo日志對(duì)比，undo no和主鍵各列信息有不同。

roll_pointer隱藏列的含義

是時(shí)候揭開roll_pointer的真實(shí)面紗了，這個(gè)占用7個(gè)字節(jié)的字段其實(shí)一點(diǎn)都不神秘，本質(zhì)上就是一個(gè)指向記錄對(duì)應(yīng)的undo日志的一個(gè)指針。比如說我們上邊向demo18表里插入了2條記錄，每條記錄都有與其對(duì)應(yīng)的一條undo日志。記錄被存儲(chǔ)到了類型為FIL_PAGE_INDEX的頁(yè)面中（就是我們前邊一直所說的數(shù)據(jù)頁(yè)），undo日志被存放到了類型為FIL_PAGE_UNDO_LOG的頁(yè)面中。效果如圖所示：

從圖中也可以更直觀的看出來，roll_pointer本質(zhì)就是一個(gè)指針，指向記錄對(duì)應(yīng)的undo日志。不過這7個(gè)字節(jié)的roll_pointer的每一個(gè)字節(jié)具體的含義我們后邊嘮叨完如何分配存儲(chǔ)undo日志的頁(yè)面之后再具體說哈～

3.2 DELETE操作對(duì)應(yīng)的undo日志

我們知道插入到頁(yè)面中的記錄會(huì)根據(jù)記錄頭信息中的next_record屬性組成一個(gè)單向鏈表，我們把這個(gè)鏈表稱之為正常記錄鏈表；我們?cè)谇斑厙Z叨數(shù)據(jù)頁(yè)結(jié)構(gòu)的時(shí)候說過，被刪除的記錄其實(shí)也會(huì)根據(jù)記錄頭信息中的next_record屬性組成一個(gè)鏈表，只不過這個(gè)鏈表中的記錄占用的存儲(chǔ)空間可以被重新利用，所以也稱這個(gè)鏈表為垃圾鏈表。PageHeader部分有一個(gè)稱之為PAGE_FREE的屬性，它指向由被刪除記錄組成的垃圾鏈表中的頭節(jié)點(diǎn)。為了故事的順利發(fā)展，我們先畫一個(gè)圖，假設(shè)此刻某個(gè)頁(yè)面中的記錄分布情況是這樣的（這個(gè)不是demo18表中的記錄，只是我們隨便舉的一個(gè)例子）：

為了突出主題，在這個(gè)簡(jiǎn)化版的示意圖中，我們只把記錄的delete_mask標(biāo)志位展示了出來。從圖中可以看出，正常記錄鏈表中包含了3條正常記錄，垃圾鏈表里包含了2條已刪除記錄，在垃圾鏈表中的這些記錄占用的存儲(chǔ)空間可以被重新利用。頁(yè)面的Page Header部分的PAGE_FREE屬性的值代表指向垃圾鏈表頭節(jié)點(diǎn)的指針。假設(shè)現(xiàn)在我們準(zhǔn)備使用DELETE語(yǔ)句把正常記錄鏈表中的最后一條記錄給刪除掉，其實(shí)這個(gè)刪除的過程需要經(jīng)歷兩個(gè)階段：

階段一：僅僅將記錄的delete_mask標(biāo)識(shí)位設(shè)置為1，其他的不做修改（其實(shí)會(huì)修改記錄的trx_id、roll_pointer這些隱藏列的值）。InnoDB把這個(gè)階段稱之為delete mark。把這個(gè)過程畫下來就是這樣：

可以看到，正常記錄鏈表中的最后一條記錄的delete_mask值被設(shè)置為1，但是并沒有被加入到垃圾鏈表。也就是此時(shí)記錄處于一個(gè)中間狀態(tài)，在刪除語(yǔ)句所在的事務(wù)提交之前，被刪除的記錄一直都處于這種所謂的中間狀態(tài)。

小提示：
為啥會(huì)有這種奇怪的中間狀態(tài)呢？其實(shí)主要是為了實(shí)現(xiàn)一個(gè)稱之為MVCC的功能，哈哈，稍后再介紹。

階段二：當(dāng)該刪除語(yǔ)句所在的事務(wù)提交之后，會(huì)有專門的線程后來真正的把記錄刪除掉。所謂真正的刪除就是把該記錄從正常記錄鏈表中移除，并且加入到垃圾鏈表中，然后還要調(diào)整一些頁(yè)面的其他信息，比如頁(yè)面中的用戶記錄數(shù)量PAGE_N_RECS、上次插入記錄的位置PAGE_LAST_INSERT、垃圾鏈表頭節(jié)點(diǎn)的指針PAGE_FREE、頁(yè)面中可重用的字節(jié)數(shù)量PAGE_GARBAGE、還有頁(yè)?錄的一些信息等等。InnoDB的把這個(gè)階段稱之為purge。

把階段二執(zhí)行完了，這條記錄就算是真正的被刪除掉了。這條已刪除記錄占用的存儲(chǔ)空間也可以被重新利用了。畫下來就是這樣：

對(duì)照著圖我們還要注意一點(diǎn)，將被刪除記錄加入到垃圾鏈表時(shí)，實(shí)際上加入到鏈表的頭節(jié)點(diǎn)處，會(huì)跟著修改PAGE_FREE屬性的值。

小提示：
頁(yè)面的Page Header部分有一個(gè)PAGE_GARBAGE屬性，該屬性記錄著當(dāng)前頁(yè)面中可重用存儲(chǔ)空間占用的總字節(jié)數(shù)。每當(dāng)有已刪除記錄被加入到垃圾鏈表后，都會(huì)把這個(gè)PAGE_GARBAGE屬性的值加上該已刪除記錄占用的存儲(chǔ)空間大小。PAGE_FREE指向垃圾鏈表的頭節(jié)點(diǎn)，之后每當(dāng)新插入記錄時(shí)，?先判斷PAGE_FREE指向的頭節(jié)點(diǎn)代表的已刪除記錄占用的存儲(chǔ)空間是否足夠容納這條新插入的記錄，如果不可以容納，就直接向頁(yè)面中申請(qǐng)新的空間來存儲(chǔ)這條記錄（是的，你沒看錯(cuò)，并不會(huì)嘗試遍歷整個(gè)垃圾鏈表，找到一個(gè)可以容納新記錄的節(jié)點(diǎn)）。如果可以容納，那么直接重用這條已刪除記錄的存儲(chǔ)空間，并且把PAGE_FREE指向垃圾鏈表中的下一條已刪除記錄。但是這里有一個(gè)問題，如果新插入的那條記錄占用的存儲(chǔ)空間大小小于垃圾鏈表的頭節(jié)點(diǎn)占用的存儲(chǔ)空間大小，那就意味頭節(jié)點(diǎn)對(duì)應(yīng)的記錄占用的存儲(chǔ)空間里有一部分空間用不到，這部分空間就被稱之為碎片空間。那這些碎片空間豈不是永遠(yuǎn)都用不到了么？其實(shí)也不是，這些碎片空間占用的存儲(chǔ)空間大小會(huì)被統(tǒng)計(jì)到PAGE_GARBAGE屬性中，這些碎片空間在整個(gè)頁(yè)面快使用完前并不會(huì)被重新利用，不過當(dāng)頁(yè)面快滿時(shí)，如果再插入一條記錄，此時(shí)頁(yè)面中并不能分配一條完整記錄的空間，這時(shí)候會(huì)?先看一看PAGE_GARBAGE的空間和剩余可利用的空間加起來是不是可以容納下這條記錄，如果可以的話，InnoDB會(huì)嘗試重新組織頁(yè)內(nèi)的記錄，重新組織的過程就是先開辟一個(gè)臨時(shí)頁(yè)面，把頁(yè)面內(nèi)的記錄依次插入一遍，因?yàn)橐来尾迦霑r(shí)并不會(huì)產(chǎn)生碎片，之后再把臨時(shí)頁(yè)面的內(nèi)容復(fù)制到本頁(yè)面，這樣就可以把那些碎片空間都解放出來（很顯然重新組織頁(yè)面內(nèi)的記錄比較耗費(fèi)性能）。

從上邊的描述中我們也可以看出來，在刪除語(yǔ)句所在的事務(wù)提交之前，只會(huì)經(jīng)歷階段一，也就是delete mark階段（提交之后我們就不用回滾了，所以只需考慮對(duì)刪除操作的階段一做的影響進(jìn)行回滾）。InnoDB為此設(shè)計(jì)了一種稱之為TRX_UNDO_DEL_MARK_REC類型的undo日志，它的完整結(jié)構(gòu)如下圖所示：

額滴個(gè)神吶，這個(gè)里邊的屬性也太多了點(diǎn)兒吧～（其實(shí)大部分屬性的意思我們上邊已經(jīng)介紹過了）是的，的確有點(diǎn)多，不過大家千萬不要在意，如果記不住千萬不要勉強(qiáng)自已，我這里把它們都列出來讓大家混個(gè)臉熟而已。勞煩大家先克服一下密集恐急癥，再抬頭大致看一遍上邊的這個(gè)類型為TRX_UNDO_DEL_MARK_REC的undo日志中的屬性，特別注意一下這幾點(diǎn)：

在對(duì)一條記錄進(jìn)行delete mark操作前，需要把該記錄的舊的trx_id和roll_pointer隱藏列的值都給記到對(duì)應(yīng)的undo日志中來，就是我們圖中顯示的oldtrx_id和old roll_pointer屬性。這樣有一個(gè)好處，那就是可以通過undo日志的old roll_pointer找到記錄在修改之前對(duì)應(yīng)的undo日志。比如說在一個(gè)事務(wù)中，我們先插入了一條記錄，然后又執(zhí)行對(duì)該記錄的刪除操作，這個(gè)過程的示意圖就是這樣：

從圖中可以看出來，執(zhí)行完delete mark操作后，它對(duì)應(yīng)的undo日志和INSERT操作對(duì)應(yīng)的undo日志就串成了一個(gè)鏈表。這個(gè)很有意思啊，這個(gè)鏈表就稱之為版本鏈，現(xiàn)在貌似看不出這個(gè)版本鏈有啥用，等我們?cè)偻罂纯矗v完UPDATE操作對(duì)應(yīng)的undo日志后，這個(gè)所謂的版本鏈就慢慢的展現(xiàn)出它的?逼之處了。

與類型為TRX_UNDO_INSERT_REC的undo日志不同，類型為TRX_UNDO_DEL_MARK_REC的undo日志還多了一個(gè)索引列各列信息的內(nèi)容，也就是說如果某個(gè)列被包含在某個(gè)索引中，那么它的相關(guān)信息就應(yīng)該被記錄到這個(gè)索引列各列信息部分，所謂的相關(guān)信息包括該列在記錄中的位置（用pos表示），該列占用的存儲(chǔ)空間大?。ㄓ?code>len表示），該列實(shí)際值（用value表示）。所以索引列各列信息存儲(chǔ)的內(nèi)容實(shí)質(zhì)上就是<pos, len, value>的一個(gè)列表。這部分信息主要是用在事務(wù)提交后，對(duì)該中間狀態(tài)記錄做真正刪除的階段二，也就是purge階段中使用的，具體如何使用現(xiàn)在我們可以忽略～

該介紹的我們介紹完了，現(xiàn)在繼續(xù)在上邊那個(gè)事務(wù)id為100的事務(wù)中刪除一條記錄，比如我們把id為1的那條記錄刪除掉：

mysql> DELETE FROM demo18 WHERE id = 1;
Query OK, 1 row affected (0.01 sec)

這個(gè)delete mark操作對(duì)應(yīng)的undo日志的結(jié)構(gòu)就是這樣：

對(duì)照著這個(gè)圖，我們得注意下邊幾點(diǎn)：

因?yàn)檫@條undo日志是id為100的事務(wù)中產(chǎn)生的第3條undo日志，所以它對(duì)應(yīng)的undo no就是2。

在對(duì)記錄做delete mark操作時(shí)，記錄的trx_id隱藏列的值是100（也就是說對(duì)該記錄最近的一次修改就發(fā)生在本事務(wù)中），所以把100填入old trx_id屬性中。然后把記錄的roll_pointer隱藏列的值取出來，填入old roll_pointer屬性中，這樣就可以通過old roll_pointer屬性值找到最近一次對(duì)該記錄做改動(dòng)時(shí)產(chǎn)生的undo日志。

由于demo18表中有2個(gè)索引：一個(gè)是聚簇索引，一個(gè)是二級(jí)索引idx_key1。只要是包含在索引中的列，那么這個(gè)列在記錄中的位置（pos），占用存儲(chǔ)空間大小（len）和實(shí)際值（value）就需要存儲(chǔ)到undo日志中。

對(duì)于主鍵來說，只包含一個(gè)id列，存儲(chǔ)到undo日志中的相關(guān)信息分別是：
- pos：id列是主鍵，也就是在記錄的第一個(gè)列，它對(duì)應(yīng)的pos值為0。pos占用1個(gè)字節(jié)來存儲(chǔ)。
- len：id列的類型為INT，占用4個(gè)字節(jié)，所以len的值為4。len占用1個(gè)字節(jié)來存儲(chǔ)。
- value：在被刪除的記錄中id列的值為1，也就是value的值為1。value占用4個(gè)字節(jié)來存儲(chǔ)。
- 畫一個(gè)圖演示一下就是這樣：

所以對(duì)于id列來說，最終存儲(chǔ)的結(jié)果就是<0, 4, 1>，存儲(chǔ)這些信息占用的存儲(chǔ)空間大小為1 + 1 + 4 = 6個(gè)字節(jié)。
對(duì)于idx_key1來說，只包含一個(gè)key1列，存儲(chǔ)到undo日志中的相關(guān)信息分別是：
- pos：key1列是排在id列、trx_id列、roll_pointer列之后的，它對(duì)應(yīng)的pos值為3。pos占用1個(gè)字節(jié)來存儲(chǔ)。
- len：key1列的類型為VARCHAR(100)，使用utf8字符集，被刪除的記錄實(shí)際存儲(chǔ)的內(nèi)容是AWM，所以一共占用3個(gè)字節(jié)，也就是所以len的值為3。len占用1個(gè)字節(jié)來存儲(chǔ)。
- value：在被刪除的記錄中key1列的值為AWM，也就是value的值為AWM。value占用3個(gè)字節(jié)來存儲(chǔ)。
畫一個(gè)圖演示一下就是這樣：

所以對(duì)于key1列來說，最終存儲(chǔ)的結(jié)果就是<3, 3, 'AWM'>，存儲(chǔ)這些信息占用的存儲(chǔ)空間大小為1 + 1 + 3 = 5個(gè)字節(jié)。

從上邊的敘述中可以看到，<0, 4, 1>和<3, 3, 'AWM'>共占用11個(gè)字節(jié)。然后index_col_info len本身占用2個(gè)字節(jié)，所以加起來一共占用13個(gè)字節(jié)，把數(shù)字13就填到了index_col_info len的屬性中。

3.3 UPDATE操作對(duì)應(yīng)的undo日志

在執(zhí)行UPDATE語(yǔ)句時(shí)，InnoDB對(duì)更新主鍵和不更新主鍵這兩種情況有截然不同的處理如案。

3.3.1 不更新主鍵的情況

在不更新主鍵的情況下，又可以細(xì)分為被更新的列占用的存儲(chǔ)空間不發(fā)生變化和發(fā)生變化的情況。

就地更新（in-place update）

更新記錄時(shí)，對(duì)于被更新的每個(gè)列來說，如果更新后的列和更新前的列占用的存儲(chǔ)空間都一樣大，那么就可以進(jìn)行就地更新，也就是直接在原記錄的基礎(chǔ)上修改對(duì)應(yīng)列的值。再次強(qiáng)調(diào)一邊，是每個(gè)列在更新前后占用的存儲(chǔ)空間一樣大，有任何一個(gè)被更新的列更新前比更新后占用的存儲(chǔ)空間大，或者更新前比更新后占用的存儲(chǔ)空間小都不能進(jìn)行就地更新。比如說現(xiàn)在demo18表里還有一條id值為2的記錄，它的各個(gè)列占用的大小如圖所示（因?yàn)椴捎胾tf8字符集，所以’步槍’這兩個(gè)字符占用6個(gè)字節(jié)）：

假如我們有這樣的UPDATE語(yǔ)句：

UPDATE demo18 SET key1 = 'P92', col = '手槍' WHERE id = 2;

在這個(gè)UPDATE語(yǔ)句中，col列從步槍被更新為手槍，前后都占用6個(gè)字節(jié)，也就是占用的存儲(chǔ)空間大小未改變；key1列從M416被更新為P92，也就是從4個(gè)字節(jié)被更新為3個(gè)字節(jié)，這就不滿足就地更新需要的條件了，所以不能進(jìn)行就地更新。但是如果UPDATE語(yǔ)句長(zhǎng)這樣：

UPDATE demo18 SET key1 = 'M249', col = '機(jī)槍' WHERE id = 2;

由于各個(gè)被更新的列在更新前后占用的存儲(chǔ)空間是一樣大的，所以這樣的語(yǔ)句可以執(zhí)行就地更新。

先刪除掉舊記錄，再插入新記錄

在不更新主鍵的情況下，如果有任何一個(gè)被更新的列更新前和更新后占用的存儲(chǔ)空間大小不一致，那么就需要先把這條舊的記錄從聚簇索引頁(yè)面中刪除掉，然后再根據(jù)更新后列的值創(chuàng)建一條新的記錄插入到頁(yè)面中。

請(qǐng)注意一下，我們這里所說的刪除并不是delete mark操作，而是真正的刪除掉，也就是把這條記錄從正常記錄鏈表中移除并加入到垃圾鏈表中，并且修改頁(yè)面中相應(yīng)的統(tǒng)計(jì)信息（比如PAGE_FREE、PAGE_GARBAGE等這些信息）。不過這里做真正刪除操作的線程并不是在嘮叨DELETE語(yǔ)句中做purge操作時(shí)使用的另外專門的線程，而是由用戶線程同步執(zhí)行真正的刪除操作，真正刪除之后緊接著就要根據(jù)各個(gè)列更新后的值創(chuàng)建的新記錄插入。

這里如果新創(chuàng)建的記錄占用的存儲(chǔ)空間大小不超過舊記錄占用的空間，那么可以直接重用被加入到垃圾鏈表中的舊記錄所占用的存儲(chǔ)空間，否則的話需要在頁(yè)面中新申請(qǐng)一段空間以供新記錄使用，如果本頁(yè)面內(nèi)已經(jīng)沒有可用的空間的話，那就需要進(jìn)行頁(yè)面分裂操作，然后再插入新記錄。

針對(duì)UPDATE不更新主鍵的情況（包括上邊所說的就地更新和先刪除舊記錄再插入新記錄），InnoDB設(shè)計(jì)了一種類型為TRX_UNDO_UPD_EXIST_REC的undo日志，它的完整結(jié)構(gòu)如下：

其實(shí)大部分屬性和我們介紹過的TRX_UNDO_DEL_MARK_REC類型的undo日志是類似的，不過還是要注意這么幾點(diǎn)：

n_updated屬性表示本條UPDATE語(yǔ)句執(zhí)行后將有幾個(gè)列被更新，后邊跟著的<pos, old_len, old_value>分別表示被更新列在記錄中的位置、更新前該列占用的存儲(chǔ)空間大小、更新前該列的真實(shí)值。
如果在UPDATE語(yǔ)句中更新的列包含索引列，那么也會(huì)添加索引列各列信息這個(gè)部分，否則的話是不會(huì)添加這個(gè)部分的。

現(xiàn)在繼續(xù)在上邊那個(gè)事務(wù)id為100的事務(wù)中更新一條記錄，比如我們把id為2的那條記錄更新一下：

BEGIN;  # 顯式開啟一個(gè)事務(wù)，假設(shè)該事務(wù)的id為100
# 插入兩條記錄
INSERT INTO demo18(id, key1, col) VALUES (1, 'AWM', '狙擊槍'), (2, 'M416', '步槍');
# 刪除一條記錄   
DELETE FROM demo18 WHERE id = 1;
# 更新一條記錄
UPDATE demo18 SET key1 = 'M249', col = '機(jī)槍' WHERE id = 2;

這個(gè)UPDATE語(yǔ)句更新的列大小都沒有改動(dòng)，所以可以采用就地更新的如式來執(zhí)行，在真正改動(dòng)頁(yè)面記錄時(shí)，會(huì)先記錄一條類型為TRX_UNDO_UPD_EXIST_REC的undo日志，長(zhǎng)這樣：

對(duì)照著這個(gè)圖我們注意一下這幾個(gè)地如：

因?yàn)檫@條undo日志是id為100的事務(wù)中產(chǎn)生的第4條undo日志，所以它對(duì)應(yīng)的undo no就是3。
這條日志的roll_pointer指向undo no為1的那條日志，也就是插入主鍵值為2的記錄時(shí)產(chǎn)生的那條undo日志，也就是最近一次對(duì)該記錄做改動(dòng)時(shí)產(chǎn)生的undo日志。
由于本條UPDATE語(yǔ)句中更新了索引列key1的值，所以需要記錄一下索引列各列信息部分，也就是把主鍵和key1列更新前的信息填入。

3.3.2 更新主鍵的情況

在聚簇索引中，記錄是按照主鍵值的大小連成了一個(gè)單向鏈表的，如果我們更新了某條記錄的主鍵值，意味著這條記錄在聚簇索引中的位置將會(huì)發(fā)生改變，比如你將記錄的主鍵值從1更新為10000，如果還有非常多的記錄的主鍵值分布在1 ~ 10000之間的話，那么這兩條記錄在聚簇索引中就有可能離得非常遠(yuǎn)，甚至中間隔了好多個(gè)頁(yè)面。針對(duì)UPDATE語(yǔ)句中更新了記錄主鍵值的這種情況，InnoDB在聚簇索引中分了兩步處理：

將舊記錄進(jìn)行delete mark操作

高能注意：這里是delete mark操作！也就是說在UPDATE語(yǔ)句所在的事務(wù)提交前，對(duì)舊記錄只做一個(gè)delete mark操作，在事務(wù)提交后才由專門的線程做purge操作，把它加入到垃圾鏈表中。這里一定要和我們上邊所說的在不更新記錄主鍵值時(shí)，先真正刪除舊記錄，再插入新記錄的如式區(qū)分開！

小提示：
之所以只對(duì)舊記錄做delete mark操作，是因?yàn)閯e的事務(wù)同時(shí)也可能訪問這條記錄，如果把它真正的刪除加入到垃圾鏈表后，別的事務(wù)就訪問不到了。這個(gè)功能就是所謂的MVCC，我們后邊的章節(jié)中會(huì)詳細(xì)嘮叨什么是個(gè)MVCC。

根據(jù)更新后各列的值創(chuàng)建一條新記錄，并將其插入到聚簇索引中（需重新定位插入的位置）。

由于更新后的記錄主鍵值發(fā)生了改變，所以需要重新從聚簇索引中定位這條記錄所在的位置，然后把它插進(jìn)去。

針對(duì)UPDATE語(yǔ)句更新記錄主鍵值的這種情況，在對(duì)該記錄進(jìn)行delete mark操作前，會(huì)記錄一條類型為TRX_UNDO_DEL_MARK_REC的undo日志；之后插入新記錄時(shí)，會(huì)記錄一條類型為TRX_UNDO_INSERT_REC的undo日志，也就是說每對(duì)一條記錄的主鍵值做改動(dòng)時(shí)，會(huì)記錄2條undo日志。這些日志的格式我們上邊都嘮叨過了，就不贅述了。

四、通用鏈表結(jié)構(gòu)

在寫入undo日志的過程中會(huì)使用到多個(gè)鏈表，很多鏈表都有同樣的節(jié)點(diǎn)結(jié)構(gòu)，如圖所示：

在某個(gè)表空間內(nèi)，我們可以通過一個(gè)頁(yè)的頁(yè)號(hào)和在頁(yè)內(nèi)的偏移量來唯一定位一個(gè)節(jié)點(diǎn)的位置，這兩個(gè)信息也就相當(dāng)于指向這個(gè)節(jié)點(diǎn)的一個(gè)指針。所以：

Pre Node Page Number和Pre Node Offset的組合就是指向前一個(gè)節(jié)點(diǎn)的指針
Next Node Page Number和Next Node Offset的組合就是指向后一個(gè)節(jié)點(diǎn)的指針。

整個(gè)List Node占用12個(gè)字節(jié)的存儲(chǔ)空間。為了更好的管理鏈表，InnoDB的提出了一個(gè)基節(jié)點(diǎn)的結(jié)構(gòu)，里邊存儲(chǔ)了這個(gè)鏈表的頭節(jié)點(diǎn)、尾節(jié)點(diǎn)以及鏈表長(zhǎng)度信息，基節(jié)點(diǎn)的結(jié)構(gòu)示意圖如下：

其中：

List Length表明該鏈表一共有多少節(jié)點(diǎn)。
First Node Page Number和First Node Offset的組合就是指向鏈表頭節(jié)點(diǎn)的指針。
Last Node Page Number和Last Node Offset的組合就是指向鏈表尾節(jié)點(diǎn)的指針。

整個(gè)List Base Node占用16個(gè)字節(jié)的存儲(chǔ)空間。所以使用List Base Node和List Node這兩個(gè)結(jié)構(gòu)組成的鏈表的示意圖就是這樣：

五、 FIL_PAGE_UNDO_LOG頁(yè)面

我們前邊嘮叨表空間的時(shí)候說過，表空間其實(shí)是由許許多多的頁(yè)面構(gòu)成的，頁(yè)面默認(rèn)大小為16KB。這些頁(yè)面有不同的類型，比如類型為FIL_PAGE_INDEX的頁(yè)面用于存儲(chǔ)聚簇索引以及二級(jí)索引，類型為FIL_PAGE_TYPE_FSP_HDR的頁(yè)面用于存儲(chǔ)表空間頭部信息的，還有其他各種類型的頁(yè)面，其中有一種稱之為FIL_PAGE_UNDO_LOG類型的頁(yè)面是專門用來存儲(chǔ)undo日志的，這種類型的頁(yè)面的通用結(jié)構(gòu)如下圖所示（以默認(rèn)的16KB大小為例）：

類型為FIL_PAGE_UNDO_LOG的頁(yè)我們就簡(jiǎn)稱為Undo頁(yè)面。上圖中的File Header和File Trailer是各種頁(yè)面都有的通用結(jié)構(gòu)，我們前邊已經(jīng)學(xué)習(xí)了很多遍了，這里就不贅述了。Undo Page Header是Undo頁(yè)面所特有的，我們來看一下它的結(jié)構(gòu)：

其中各個(gè)屬性的意思如下：

TRX_UNDO_PAGE_TYPE：本頁(yè)面準(zhǔn)備存儲(chǔ)什么種類的undo日志。

我們前邊介紹了好幾種類型的undo日志，它們可以被分為兩個(gè)大類：

TRX_UNDO_INSERT（使用十進(jìn)制1表示）：類型為TRX_UNDO_INSERT_REC的undo日志屬于此大類，一般由INSERT語(yǔ)句產(chǎn)生，或者在UPDATE語(yǔ)句中有更新主鍵的情況也會(huì)產(chǎn)生此類型的undo日志。
TRX_UNDO_UPDATE（使用十進(jìn)制2表示），除了類型為TRX_UNDO_INSERT_REC的undo日志，其他類型的undo日志都屬于這個(gè)大類，比如我們前邊說的TRX_UNDO_DEL_MARK_REC、TRX_UNDO_UPD_EXIST_REC等，一般由DELETE、UPDATE語(yǔ)句產(chǎn)生的undo日志屬于這個(gè)大類。

這個(gè)TRX_UNDO_PAGE_TYPE屬性可選的值就是上邊的兩個(gè)，用來標(biāo)記本頁(yè)面用于存儲(chǔ)哪個(gè)大類的undo日志，不同大類的undo日志不能混著存儲(chǔ)，比如一個(gè)Undo頁(yè)面的TRX_UNDO_PAGE_TYPE屬性值為TRX_UNDO_INSERT，那么這個(gè)頁(yè)面就只能存儲(chǔ)類型為TRX_UNDO_INSERT_REC的undo日志，其他類型的undo日志就不能放到這個(gè)頁(yè)面中了。

小提示：
之所以把undo日志分成兩個(gè)大類，是因?yàn)轭愋蜑門RX_UNDO_INSERT_REC的undo日志在事務(wù)提交后可以直接刪除掉，而其他類型的undo日志還需要為所謂的MVCC服務(wù)，不能直接刪除掉，對(duì)它們的處理需要區(qū)別對(duì)待。當(dāng)然，如果你看這段話迷迷糊糊的話，那就不需要再看一遍了，現(xiàn)在只需要知道undo日志分為2個(gè)大類就好了，更詳細(xì)的東西我們后邊會(huì)有講解。

TRX_UNDO_PAGE_START：表示在當(dāng)前頁(yè)面中是從什么位置開始存儲(chǔ)undo日志的，或者說表示第一條undo日志在本頁(yè)面中的起始偏移量。
TRX_UNDO_PAGE_FREE：與上邊的TRX_UNDO_PAGE_START對(duì)應(yīng)，表示當(dāng)前頁(yè)面中存儲(chǔ)的最后一條undo日志結(jié)束時(shí)的偏移量，或者說從這個(gè)位置開始，可以繼續(xù)寫入新的undo日志。

假設(shè)現(xiàn)在向頁(yè)面中寫入了3條undo日志，那么TRX_UNDO_PAGE_START和TRX_UNDO_PAGE_FREE的示意圖就是這樣：

當(dāng)然，在最初一條undo日志也沒寫入的情況下，TRX_UNDO_PAGE_START和TRX_UNDO_PAGE_FREE的值是相同的。

TRX_UNDO_PAGE_NODE：代表一個(gè)List Node結(jié)構(gòu)（鏈表的普通節(jié)點(diǎn)，我們上邊剛說的），下邊馬上用到這個(gè)屬性，稍安勿躁。

六、Undo頁(yè)面鏈表

6.1 單個(gè)事務(wù)中的Undo頁(yè)面鏈表

因?yàn)橐粋€(gè)事務(wù)可能包含多個(gè)語(yǔ)句，而且一個(gè)語(yǔ)句可能對(duì)若干條記錄進(jìn)行改動(dòng)，而對(duì)每條記錄進(jìn)行改動(dòng)前，都需要記錄1條或2條的undo日志，所以在一個(gè)事務(wù)執(zhí)行過程中可能產(chǎn)生很多undo日志，這些日志可能一個(gè)頁(yè)面放不下，需要放到多個(gè)頁(yè)面中，這些頁(yè)面就通過我們上邊介紹的TRX_UNDO_PAGE_NODE屬性連成了鏈表：

大家可以看一看上邊的圖，一邊情況下把鏈表中的第一個(gè)Undo頁(yè)稱它為first undo page，因?yàn)樵?code>first undo page中除了記錄Undo Page Header之外，還會(huì)記錄其他的一些管理信息。其余的Undo頁(yè)面稱之為normal undo page。

在一個(gè)事務(wù)執(zhí)行過程中，可能混著執(zhí)行INSERT、DELETE、UPDATE語(yǔ)句，也就意味著會(huì)產(chǎn)生不同類型的undo日志。但是我們前邊又說過，同一個(gè)Undo頁(yè)面要么只存儲(chǔ)TRX_UNDO_INSERT大類的undo日志，要么只存儲(chǔ)TRX_UNDO_UPDATE大類的undo日志，反正不能混著存，所以在一個(gè)事務(wù)執(zhí)行過程中就可能需要2個(gè)Undo頁(yè)面的鏈表，一個(gè)稱之為insert undo鏈表，另一個(gè)稱之為update undo鏈表，畫個(gè)示意圖就是這樣：

另外，InnoDB對(duì)普通表和臨時(shí)表的記錄改動(dòng)時(shí)產(chǎn)生的undo日志要分別記錄（后邊會(huì)有講解），所以在一個(gè)事務(wù)中最多有4個(gè)以Undo頁(yè)面為節(jié)點(diǎn)組成的鏈表：

當(dāng)然，并不是在事務(wù)一開始就會(huì)為這個(gè)事務(wù)分配這4個(gè)鏈表，而是按需分配，具體分配策略如下：

剛剛開啟事務(wù)時(shí)，一個(gè)Undo頁(yè)面鏈表也不分配。
當(dāng)事務(wù)執(zhí)行過程中向普通表中插入記錄或者執(zhí)行更新記錄主鍵- - 的操作之后，就會(huì)為其分配一個(gè)普通表的insert undo鏈表。
當(dāng)事務(wù)執(zhí)行過程中刪除或者更新了普通表中的記錄之后，就會(huì)為其分配一個(gè)普通表的update undo鏈表。
當(dāng)事務(wù)執(zhí)行過程中向臨時(shí)表中插入記錄或者執(zhí)行更新記錄主鍵的操作之后，就會(huì)為其分配一個(gè)臨時(shí)表的insert undo鏈表。
當(dāng)事務(wù)執(zhí)行過程中刪除或者更新了臨時(shí)表中的記錄之后，就會(huì)為其分配一個(gè)臨時(shí)表的update undo鏈表。
總結(jié)一下就是：什么時(shí)候需要啥時(shí)候再分配，不需要就不分配。

總結(jié)一下就是：什么時(shí)候需要啥時(shí)候再分配，不需要就不分配。

6.2 多個(gè)事務(wù)中的Undo頁(yè)面鏈表

為了盡可能提高undo日志的寫入效率，不同事務(wù)執(zhí)行過程中產(chǎn)生的undo日志需要被寫入到不同的Undo頁(yè)面鏈表中。比如說現(xiàn)在有事務(wù)id分別為

1、2的兩個(gè)事務(wù)，我們分別稱之為trx 1和trx 2，假設(shè)在這兩個(gè)事務(wù)執(zhí)行過程中：

trx 1對(duì)普通表做了DELETE操作，對(duì)臨時(shí)表做了INSERT和UPDATE操作。
InnoDB會(huì)為trx 1分配3個(gè)鏈表，分別是：
- 針對(duì)普通表的update undo鏈表
- 針對(duì)臨時(shí)表的insert undo鏈表
- 針對(duì)臨時(shí)表的update undo鏈表。
trx 2對(duì)普通表做了INSERT、UPDATE和DELETE操作，沒有對(duì)臨時(shí)表做改動(dòng)。
InnoDB會(huì)為trx 2分配2個(gè)鏈表，分別是：
- 針對(duì)普通表的insert undo鏈表
- 針對(duì)普通表的update undo鏈表。

綜上所述，在trx 1和trx 2執(zhí)行過程中，InnoDB共需為這兩個(gè)事務(wù)分配5個(gè)Undo頁(yè)面鏈表，畫個(gè)圖就是這樣：

如果有更多的事務(wù)，那就意味著可能會(huì)產(chǎn)生更多的Undo頁(yè)面鏈表。

七、undo日志具體寫入過程

7.1 段（Segment）的概念

如果你有認(rèn)真看過表空間那一章的話，對(duì)這個(gè)段的概念應(yīng)該印象深刻，我們當(dāng)時(shí)花了非常大的篇幅來嘮叨這個(gè)概念。簡(jiǎn)單講，這個(gè)段是一個(gè)邏輯上的概念，本質(zhì)上是由若干個(gè)零散頁(yè)面和若干個(gè)完整的區(qū)組成的。比如一個(gè)B+樹索引被劃分成兩個(gè)段，一個(gè)葉子節(jié)點(diǎn)段，一個(gè)非葉子節(jié)點(diǎn)段，這樣葉子節(jié)點(diǎn)就可以被盡可能的存到一起，非葉子節(jié)點(diǎn)被盡可能的存到一起。每一個(gè)段對(duì)應(yīng)一個(gè)INODE Entry結(jié)構(gòu)，這個(gè)INODE Entry結(jié)構(gòu)描述了這個(gè)段的各種信息，比如段的ID，段內(nèi)的各種鏈表基節(jié)點(diǎn)，零散頁(yè)面的頁(yè)號(hào)有哪些等信息（具體該結(jié)構(gòu)中每個(gè)屬性的意思大家可以到表空間那一章里再次重溫一下）。我們前邊也說過，為了定位一個(gè)INODE Entry，InnoDB的設(shè)計(jì)了一個(gè)Segment Header的結(jié)構(gòu)：

整個(gè)Segment Header占用10個(gè)字節(jié)大小，各個(gè)屬性的意思如下：

Space ID of the INODE Entry：INODE Entry結(jié)構(gòu)所在的表空間ID。
Page Number of the INODE Entry：INODE Entry結(jié)構(gòu)所在的頁(yè)面頁(yè)號(hào)。
Byte Offset of the INODE Ent：INODE Entry結(jié)構(gòu)在該頁(yè)面中的偏移量

知道了表空間ID、頁(yè)號(hào)、頁(yè)內(nèi)偏移量，不就可以唯一定位一個(gè)INODE Entry的地址了么～

小提士：
這部分關(guān)于段的各種概念我們?cè)诒砜臻g那一章中都有詳細(xì)解釋，在這里重提一下只是為了喚醒大家沉睡的記憶，如果有任何不清楚的地方可以再次跳回表空間的那一章仔細(xì)讀一下

7.2 Undo Log Segment Header

InnoDB的規(guī)定，每一個(gè)Undo頁(yè)面鏈表都對(duì)應(yīng)著一個(gè)段，稱之為Undo Log Segment。也就是說鏈表中的頁(yè)面都是從這個(gè)段里邊申請(qǐng)的，所以他們?cè)赨ndo頁(yè)面鏈表的第一個(gè)頁(yè)面，也就是上邊提到的first undo page中設(shè)計(jì)了一個(gè)稱之為Undo Log Segment Header的部分，這個(gè)部分中包含了該鏈表對(duì)應(yīng)的段的segment header信息以及其他的一些關(guān)于這個(gè)段的信息，所以Undo頁(yè)面鏈表的第一個(gè)頁(yè)面其實(shí)長(zhǎng)這樣：

可以看到這個(gè)Undo鏈表的第一個(gè)頁(yè)面比普通頁(yè)面多了個(gè)Undo Log Segment Header，我們來看一下它的結(jié)構(gòu)：

其中各個(gè)屬性的意思如下：

TRX_UNDO_STATE：本Undo頁(yè)面鏈表處在什么狀態(tài)。一個(gè)Undo Log Segment可能處在的狀態(tài)包括如下：
- TRX_UNDO_ACTIVE：活躍狀態(tài)，也就是一個(gè)活躍的事務(wù)正在往這個(gè)段里邊寫入undo日志。
- TRX_UNDO_CACHED：被緩存的狀態(tài)。處在該狀態(tài)的Undo頁(yè)面鏈表等待著之后被其他事務(wù)重用。
- TRX_UNDO_TO_FREE：對(duì)于insert undo鏈表來說，如果在它對(duì)應(yīng)的事務(wù)提交之后，該鏈表不能被重用，那么就會(huì)處于這種狀態(tài)。
- TRX_UNDO_TO_PURGE：對(duì)于update undo鏈表來說，如果在它對(duì)應(yīng)的事務(wù)提交之后，該鏈表不能被重用，那么就會(huì)處于這種狀態(tài)。
- TRX_UNDO_PREPARED：包含處于PREPARE階段的事務(wù)產(chǎn)生的undo日志

小提士：
Undo頁(yè)面鏈表什么時(shí)候會(huì)被重用，怎么重用我們之后會(huì)詳細(xì)說的。事務(wù)的PREPARE階段是在所謂的分布式事務(wù)中才出現(xiàn)的，本書中不會(huì)介紹更多關(guān)于分布式事務(wù)的事情，所以大家目前忽略這個(gè)狀態(tài)就好了

TRX_UNDO_LAST_LOG：本Undo頁(yè)面鏈表中最后一個(gè)Undo Log Header的位置。
TRX_UNDO_FSEG_HEADER：本Undo頁(yè)面鏈表對(duì)應(yīng)的段的Segment Header信息（就是我們上一節(jié)介紹的那個(gè)10字節(jié)結(jié)構(gòu)，通過這個(gè)信息可以找到該段對(duì)應(yīng)的INODE Entry）
TRX_UNDO_PAGE_LIST：Undo頁(yè)面鏈表的基節(jié)點(diǎn)。

我們上邊說Undo頁(yè)面的Undo Page Header部分有一個(gè)12字節(jié)大小的TRX_UNDO_PAGE_NODE屬性，這個(gè)屬性代表一個(gè)List Node結(jié)構(gòu)。每一個(gè)Undo頁(yè)面都包含Undo Page Header結(jié)構(gòu)，這些頁(yè)面就可以通過這個(gè)屬性連成一個(gè)鏈表。這個(gè)TRX_UNDO_PAGE_LIST屬性代表著這個(gè)鏈表的基節(jié)點(diǎn)，當(dāng)然這個(gè)基節(jié)點(diǎn)只存在于Undo頁(yè)面鏈表的第一個(gè)頁(yè)面，也就是first undo page中。

Undo Log Header

一個(gè)事務(wù)在向Undo頁(yè)面中寫入undo日志時(shí)的方式是十分簡(jiǎn)單暴力的，就是直接往里寫，寫完一條緊接著寫另一條，各條undo日志之間是親密無間的。寫完一個(gè)Undo頁(yè)面后，再?gòu)亩卫锷暾?qǐng)一個(gè)新頁(yè)面，然后把這個(gè)頁(yè)面插入到Undo頁(yè)面鏈表中，繼續(xù)往這個(gè)新申請(qǐng)的頁(yè)面中寫。InnoDB的認(rèn)為同一個(gè)事務(wù)向一個(gè)Undo頁(yè)面鏈表中寫入的undo日志算是一個(gè)組，比方說我們上邊介紹的trx 1由于會(huì)分配3個(gè)Undo頁(yè)面鏈表，也就會(huì)寫入3個(gè)組的undo日志；trx 2由于會(huì)分配2個(gè)Undo頁(yè)面鏈表，也就會(huì)寫入2個(gè)組的undo日志。在每寫入一組undo日志時(shí)，都會(huì)在這組undo日志前先記錄一下關(guān)于這個(gè)組的一些屬性，InnoDB把存儲(chǔ)這些屬性的地方稱之為Undo Log Header。所以Undo頁(yè)面鏈表的第一個(gè)頁(yè)面在真正寫入undo日志前，其實(shí)都會(huì)被填充Undo Page Header、Undo Log Segment Header、Undo Log Header這3個(gè)部分，如圖所示：

這個(gè)Undo Log Header具體的結(jié)構(gòu)如下：

又是一大堆屬性，我們先大致看一下它們都是啥意思：

TRX_UNDO_TRX_ID：生成本組undo日志的事務(wù)id
TRX_UNDO_TRX_NO：事務(wù)提交后生成的一個(gè)需要序號(hào)，使用此序號(hào)來標(biāo)記事務(wù)的提交順序（先提交的此序號(hào)小，后提交的此序號(hào)大）。
TRX_UNDO_DEL_MARKS：標(biāo)記本組undo日志中是否包含由于Delete mark操作產(chǎn)生的undo日志。
TRX_UNDO_LOG_START：表示本組undo日志中第一條undo日志的在頁(yè)面中的偏移量。
TRX_UNDO_XID_EXISTS：本組undo日志是否包含XID信息。
TRX_UNDO_DICT_TRANS：標(biāo)記本組undo日志是不是由DDL語(yǔ)句產(chǎn)生的。
TRX_UNDO_TABLE_ID：如果TRX_UNDO_DICT_TRANS為真，那么本屬性表示DDL語(yǔ)句操作的表的table id。
TRX_UNDO_NEXT_LOG：下一組的undo日志在頁(yè)面中開始的偏移量。
TRX_UNDO_PREV_LOG：上一組的undo日志在頁(yè)面中開始的偏移量。

小提士：
一般來說一個(gè)Undo頁(yè)面鏈表只存儲(chǔ)一個(gè)事務(wù)執(zhí)行過程中產(chǎn)生的一組undo日志，但是在某些情況下，可能會(huì)在一個(gè)事務(wù)提交之后，之后開啟的事務(wù)重復(fù)利用這個(gè)Undo頁(yè)面鏈表，這樣就會(huì)導(dǎo)致一個(gè)Undo頁(yè)面中可能存放多組Undo日志，TRX_UNDO_NEXT_LOG和TRX_UNDO_PREV_LOG就是用來標(biāo)記下一組和上一組undo日志在頁(yè)面中的偏移量的。關(guān)于什么時(shí)候重用Undo頁(yè)面鏈表，怎么重用這個(gè)鏈表我們稍后會(huì)詳細(xì)說明的，現(xiàn)在先理解TRX_UNDO_NEXT_LOG和TRX_UNDO_PREV_LOG這兩個(gè)屬性的意思就好了。

TRX_UNDO_HISTORY_NODE：一個(gè)12字節(jié)的List Node結(jié)構(gòu)，代表一個(gè)稱之為History鏈表的節(jié)點(diǎn)。

小結(jié)

對(duì)于沒有被重用的Undo頁(yè)面鏈表來說，鏈表的第一個(gè)頁(yè)面，也就是first undo page在真正寫入undo日志前，會(huì)填充Undo Page Header、Undo Log Segment Header、Undo Log Header這3個(gè)部分，之后才開始正式寫入undo日志。對(duì)于其他的頁(yè)面來說，也就是normal undo page在真正寫入undo日志前，只會(huì)填充Undo Page Header。鏈表的List Base Node存放到first undo page的Undo Log Segment Header部分，List Node信息存放到每一個(gè)Undo頁(yè)面的undo Page Header部分，所以畫一個(gè)Undo頁(yè)面鏈表的示意圖就是這樣：

八、重用Undo頁(yè)面

我們前邊說為了能提高并發(fā)執(zhí)行的多個(gè)事務(wù)寫入undo日志的性能，InnoDB決定為每個(gè)事務(wù)單獨(dú)分配相應(yīng)的Undo頁(yè)面鏈表（最多可能單獨(dú)分配4個(gè)鏈表）。但是這樣也造成了一些問題，比如其實(shí)大部分事務(wù)執(zhí)行過程中可能只修改了一條或幾條記錄，針對(duì)某個(gè)Undo頁(yè)面鏈表只產(chǎn)生了非常少的undo日志，這些undo日志可能只占用一丟丟存儲(chǔ)空間，每開啟一個(gè)事務(wù)就新創(chuàng)建一個(gè)Undo頁(yè)面鏈表（雖然這個(gè)鏈表中只有一個(gè)頁(yè)面）來存儲(chǔ)這么一丟丟undo日志豈不是太浪費(fèi)了么？的確是挺浪費(fèi)，于是InnoDB決定在事務(wù)提交后在某些情況下重用該事務(wù)的Undo頁(yè)面鏈表。一個(gè)Undo頁(yè)面鏈表是否可以被重用的條件很簡(jiǎn)單：

該鏈表中只包含一個(gè)Undo頁(yè)面
如果一個(gè)事務(wù)執(zhí)行過程中產(chǎn)生了非常多的undo日志，那么它可能申請(qǐng)非常多的頁(yè)面加入到Undo頁(yè)面鏈表中。在該事物提交后，如果將整個(gè)鏈表中的頁(yè)面都重用，那就意味著即使新的事務(wù)并沒有向該Undo頁(yè)面鏈表中寫入很多undo日志，那該鏈表中也得維護(hù)非常多的頁(yè)面，那些用不到的頁(yè)面也不能被別的事務(wù)所使用，這樣就造成了另一種浪費(fèi)。所以InnoDB的規(guī)定，只有在Undo頁(yè)面鏈表中只包含一個(gè)Undo頁(yè)面時(shí)，該鏈表才可以被下一個(gè)事務(wù)所重用

該Undo頁(yè)面已經(jīng)使用的空間小于整個(gè)頁(yè)面空間的3/4

我們前邊說過，Undo頁(yè)面鏈表按照存儲(chǔ)的undo日志所屬的大類可以被分為insert undo鏈表和update undo鏈表兩種，這兩種鏈表在被重用時(shí)的策略也是不同的，我們分別看一下

insert undo鏈表

insert undo鏈表中只存儲(chǔ)類型為TRX_UNDO_INSERT_REC的undo日志，這種類型的undo日志在事務(wù)提交之后就沒用了，就可以被清除掉。所以在某個(gè)事務(wù)提交后，重用這個(gè)事務(wù)的insert undo鏈表（這個(gè)鏈表中只有一個(gè)頁(yè)面）時(shí)，可以直接把之前事務(wù)寫入的一組undo日志覆蓋掉，從頭開始寫入新事務(wù)的一組undo日志，如下圖所示：

如圖所示，假設(shè)有一個(gè)事務(wù)使用的insert undo鏈表，到事務(wù)提交時(shí)，只向insert undo鏈表中插入了3條undo日志，這個(gè)insert undo鏈表只申請(qǐng)了一個(gè)Undo頁(yè)面。假設(shè)此刻該頁(yè)面已使用的空間小于整個(gè)頁(yè)面大小的3/4，那么下一個(gè)事務(wù)就可以重用這個(gè)insert undo鏈表（鏈表中只有一個(gè)頁(yè)面）。假設(shè)此時(shí)有一個(gè)新事務(wù)重用了該insert undo鏈表，那么可以直接把舊的一組undo日志覆蓋掉，寫入一組新的undo日志。

update undo鏈表

在一個(gè)事務(wù)提交后，它的update undo鏈表中的undo日志也不能立即刪除掉（這些日志用于MVCC，我們后邊會(huì)說的）。所以如果之后的事務(wù)想重用update undo鏈表時(shí)，就不能覆蓋之前事務(wù)寫入的undo日志。這樣就相當(dāng)于在同一個(gè)Undo頁(yè)面中寫入了多組的undo日志，效果看起來就是這樣

九、回滾段

9.1 回滾段的概念

我們現(xiàn)在知道一個(gè)事務(wù)在執(zhí)行過程中最多可以分配4個(gè)Undo頁(yè)面鏈表，在同一時(shí)刻不同事務(wù)擁有的Undo頁(yè)面鏈表是不一樣的，所以在同一時(shí)刻系統(tǒng)里其實(shí)可以有許許多多個(gè)Undo頁(yè)面鏈表存在。為了更好的管理這些鏈表，InnoDB又設(shè)計(jì)了一個(gè)稱之為Rollback Segment Header的頁(yè)面，在這個(gè)頁(yè)面中存放了各個(gè)Undo頁(yè)面鏈表的frist undo page的頁(yè)號(hào)，他們把這些頁(yè)號(hào)稱之為undo slot。我們可以這樣理解，每個(gè)Undo頁(yè)面鏈表都相當(dāng)于是一個(gè)班，這個(gè)鏈表的first undo page就相當(dāng)于這個(gè)班的班長(zhǎng)，找到了這個(gè)班的班長(zhǎng)，就可以找到班里的其他同學(xué)（其他同學(xué)相當(dāng)于normal undo page）。有時(shí)候?qū)W校需要向這些班級(jí)傳達(dá)一下精神，就需要把班長(zhǎng)都召集在會(huì)議室，這個(gè)Rollback Segment Header就相當(dāng)于是一個(gè)會(huì)議室。

我們看一下這個(gè)稱之為Rollback Segment Header的頁(yè)面長(zhǎng)啥樣（以默認(rèn)的16KB為例）：

InnoDB規(guī)定，每一個(gè)Rollback Segment Header頁(yè)面都對(duì)應(yīng)著一個(gè)段，這個(gè)段就稱為Rollback Segment，也就是回滾段。與我們之前介紹的各種段不同的是，這個(gè)Rollback Segment里其實(shí)只有一個(gè)頁(yè)面（這可能是InnoDB可能覺得為了某個(gè)目的去分配頁(yè)面的話都得先申請(qǐng)一個(gè)段，或者他們覺得雖然目前版本的MySQL里Rollback Segment里其實(shí)只有一個(gè)頁(yè)面，但可能之后的版本里會(huì)增加頁(yè)面也說不定）。

了解了Rollback Segment的含義之后，我們?cè)賮砜纯催@個(gè)稱之為Rollback Segment Header的頁(yè)面的各個(gè)部分的含義都是啥意思：

TRX_RSEG_MAX_SIZE：本Rollback Segment中管理的所有Undo頁(yè)面鏈表中的Undo頁(yè)面數(shù)量之和的最大值。換句話說，本Rollback Segment中所有Undo頁(yè)面鏈表中的Undo頁(yè)面數(shù)量之和不能超過TRX_RSEG_MAX_SIZE代表的值。

該屬性的值默認(rèn)為無限大，也就是我們想寫多少Undo頁(yè)面都可以。

小提士：
無限大其實(shí)也只是個(gè)夸張的說法，4個(gè)字節(jié)能表示最大的數(shù)也就是0xFFFFFFFF，但是我們之后會(huì)看到，0xFFFFFFFF這個(gè)數(shù)有特殊用途，所以實(shí)際上TRX_RSEG_MAX_SIZE的值為0xFFFFFFFE。

TRX_RSEG_HISTORY_SIZE：History鏈表占用的頁(yè)面數(shù)量。
TRX_RSEG_HISTORY：History鏈表的基節(jié)點(diǎn)。
TRX_RSEG_FSEG_HEADER：本Rollback Segment對(duì)應(yīng)的10字節(jié)大小的Segment Header結(jié)構(gòu)，通過它可以找到本段對(duì)應(yīng)的INODE Entry。

TRX_RSEG_UNDO_SLOTS：各個(gè)Undo頁(yè)面鏈表的first undo page的頁(yè)號(hào)集合，也就是undo slot集合。

一個(gè)頁(yè)號(hào)占用4個(gè)字節(jié)，對(duì)于16KB大小的頁(yè)面來說，這個(gè)TRX_RSEG_UNDO_SLOTS部分共存儲(chǔ)了1024個(gè)undo slot，所以共需1024 × 4 = 4096個(gè)字節(jié)

9.2 從回滾段中申請(qǐng)Undo頁(yè)面鏈表

初始情況下，由于未向任何事務(wù)分配任何Undo頁(yè)面鏈表，所以對(duì)于一個(gè)Rollback Segment Header頁(yè)面來說，它的各個(gè)undo slot都被設(shè)置成了一個(gè)特殊的值：FIL_NULL（對(duì)應(yīng)的十六進(jìn)制就是0xFFFFFFFF），表示該undo slot不指向任何頁(yè)面。

隨著時(shí)間的流逝，開始有事務(wù)需要分配Undo頁(yè)面鏈表了，就從回滾段的第一個(gè)undo slot開始，看看該undo slot的值是不是FIL_NULL：

如果是FIL_NULL，那么在表空間中新創(chuàng)建一個(gè)段（也就是Undo Log Segment），然后從段里申請(qǐng)一個(gè)頁(yè)面作為Undo頁(yè)面鏈表的first undo page，然后把該undo slot的值設(shè)置為剛剛申請(qǐng)的這個(gè)頁(yè)面的頁(yè)號(hào)，這樣也就意味著這個(gè)undo slot被分配給了這個(gè)事務(wù)。
如果不是FIL_NULL，說明該undo slot已經(jīng)指向了一個(gè)undo鏈表，也就是說這個(gè)undo slot已經(jīng)被別的事務(wù)占用了，那就跳到下一個(gè)undo slot，判斷該undo slot的值是不是FIL_NULL，重復(fù)上邊的步驟。

一個(gè)Rollback Segment Header頁(yè)面中包含1024個(gè)undo slot，如果這1024個(gè)undo slot的值都不為FIL_NULL，這就意味著這1024個(gè)undo slot都已經(jīng)名花有主（被分配給了某個(gè)事務(wù)），此時(shí)由于新事務(wù)無法再獲得新的Undo頁(yè)面鏈表，就會(huì)回滾這個(gè)事務(wù)并且給用戶報(bào)錯(cuò)：

Too many active concurrent transactions

用戶看到這個(gè)錯(cuò)誤，可以選擇重新執(zhí)行這個(gè)事務(wù)（可能重新執(zhí)行時(shí)有別的事務(wù)提交了，該事務(wù)就可以被分配Undo頁(yè)面鏈表了）。

當(dāng)一個(gè)事務(wù)提交時(shí)，它所占用的undo slot有兩種命運(yùn)：

如果該undo slot指向的Undo頁(yè)面鏈表符合被重用的條件（就是我們上邊說的Undo頁(yè)面鏈表只占用一個(gè)頁(yè)面并且已使用空間小于整個(gè)頁(yè)面的3/4）。

該undo slot就處于被緩存的狀態(tài)，InnoDB規(guī)定這時(shí)該Undo頁(yè)面鏈表的TRX_UNDO_STATE屬性（該屬性在first undo page的Undo Log Segment Header部分）會(huì)被設(shè)置為TRX_UNDO_CACHED。

被緩存的undo slot都會(huì)被加入到一個(gè)鏈表，根據(jù)對(duì)應(yīng)的Undo頁(yè)面鏈表的類型不同，也會(huì)被加入到不同的鏈表：

如果對(duì)應(yīng)的Undo頁(yè)面鏈表是insert undo鏈表，則該undo slot會(huì)被加入insert undo cached鏈表。
如果對(duì)應(yīng)的Undo頁(yè)面鏈表是update undo鏈表，則該undo slot會(huì)被加入update undo cached鏈表。

一個(gè)回滾段就對(duì)應(yīng)著上述兩個(gè)cached鏈表，如果有新事務(wù)要分配undo slot時(shí)，先從對(duì)應(yīng)的cached鏈表中找。如果沒有被緩存的undo slot，才會(huì)到回滾段的Rollback Segment Header頁(yè)面中再去找。

如果該undo slot指向的Undo頁(yè)面鏈表不符合被重用的條件，那么針對(duì)該undo slot對(duì)應(yīng)的Undo頁(yè)面鏈表類型不同，也會(huì)有不同的處理：
如果對(duì)應(yīng)的Undo頁(yè)面鏈表是insert undo鏈表，則該Undo頁(yè)面鏈表的TRX_UNDO_STATE屬性會(huì)被設(shè)置為TRX_UNDO_TO_FREE，之后該Undo頁(yè)面鏈表對(duì)應(yīng)的段會(huì)被釋放掉（也就意味著段中的頁(yè)面可以被挪作他用），然后把該undo slot的值設(shè)置為FIL_NULL。
如果對(duì)應(yīng)的Undo頁(yè)面鏈表是update undo鏈表，則該Undo頁(yè)面鏈表的TRX_UNDO_STATE屬性會(huì)被設(shè)置為TRX_UNDO_TO_PRUGE，則會(huì)將該undo slot的值設(shè)置為FIL_NULL，然后將本次事務(wù)寫入的一組undo日志放到所謂的History鏈表中（需要注意的是，這里并不會(huì)將Undo頁(yè)面鏈表對(duì)應(yīng)的段給釋放掉，因?yàn)檫@些undo日志還有用呢～）

9.3 多個(gè)回滾段

我們說一個(gè)事務(wù)執(zhí)行過程中最多分配4個(gè)Undo頁(yè)面鏈表，而一個(gè)回滾段里只有1024個(gè)undo slot，很顯然undo slot的數(shù)量有點(diǎn)少啊。我們即使假設(shè)一個(gè)讀寫事務(wù)執(zhí)行過程中只分配1個(gè)Undo頁(yè)面鏈表，那1024個(gè)undo slot也只能支持1024個(gè)讀寫事務(wù)同時(shí)執(zhí)行，再多了就崩潰了。這就相當(dāng)于會(huì)議室只能容下1024個(gè)班長(zhǎng)同時(shí)開會(huì)，如果有幾千人同時(shí)到會(huì)議室開會(huì)的話，那后來的那些班長(zhǎng)就沒地方坐了，只能等待前邊的人開完會(huì)自己再進(jìn)去開。

話說在InnoDB的早期發(fā)展階段的確只有一個(gè)回滾段，但是InnoDB后來意識(shí)到了這個(gè)問題，咋解決這問題呢？會(huì)議室不夠，多蓋幾個(gè)會(huì)議室不就得了。所以InnoDB一口氣定義了128個(gè)回滾段，也就相當(dāng)于有了128 × 1024 = 131072個(gè)undo slot。假設(shè)一個(gè)讀寫事務(wù)執(zhí)行過程中只分配1個(gè)Undo頁(yè)面鏈表，那么就可以同時(shí)支持131072個(gè)讀寫事務(wù)并發(fā)執(zhí)行（這么多事務(wù)在一臺(tái)機(jī)器上并發(fā)執(zhí)行，還真沒見過呢～）

每個(gè)回滾段都對(duì)應(yīng)著一個(gè)Rollback Segment Header頁(yè)面，有128個(gè)回滾段，自然就要有128個(gè)Rollback Segment Header頁(yè)面，這些頁(yè)面的地址總得找個(gè)地方存一下吧！于是InnoDB在系統(tǒng)表空間的第5號(hào)頁(yè)面的某個(gè)區(qū)域包含了128個(gè)8字節(jié)大小的格子：

每個(gè)8字節(jié)的格子的構(gòu)造就像這樣：

如果所示，每個(gè)8字節(jié)的格子其實(shí)由兩部分組成：

4字節(jié)大小的Space ID，代表一個(gè)表空間的ID。
4字節(jié)大小的Page number，代表一個(gè)頁(yè)號(hào)。

也就是說每個(gè)8字節(jié)大小的格子相當(dāng)于一個(gè)指針，指向某個(gè)表空間中的某個(gè)頁(yè)面，這些頁(yè)面就是Rollback Segment Header。這里需要注意的一點(diǎn)事，要定位一個(gè)Rollback Segment Header還需要知道對(duì)應(yīng)的表空間ID，這也就意味著不同的回滾段可能分布在不同的表空間中。

所以通過上邊的敘述我們可以大致清楚，在系統(tǒng)表空間的第5號(hào)頁(yè)面中存儲(chǔ)了128個(gè)Rollback Segment Header頁(yè)面地址，每個(gè)Rollback Segment Header就相當(dāng)于一個(gè)回滾段。在Rollback Segment Header頁(yè)面中，又包含1024個(gè)undo slot，每個(gè)undo slot都對(duì)應(yīng)一個(gè)Undo頁(yè)面鏈表。我們畫個(gè)示意圖：

把圖一畫出來就清爽多了。

9.4 回滾段的分類

我們把這128個(gè)回滾段給編一下號(hào)，最開始的回滾段稱之為第0號(hào)回滾段，之后依次遞增，最后一個(gè)回滾段就稱之為第127號(hào)回滾段。這128個(gè)回滾段可以被分成兩大類：

第0號(hào)、第33～127號(hào)回滾段屬于一類。其中第0號(hào)回滾段必須在系統(tǒng)表空間中（就是說第0號(hào)回滾段對(duì)應(yīng)的Rollback Segment Header頁(yè)面必須在系統(tǒng)表空間中），第33～127號(hào)回滾段既可以在系統(tǒng)表空間中，也可以在自己配置的undo表空間中，關(guān)于怎么配置我們稍后再說。

如果一個(gè)事務(wù)在執(zhí)行過程中由于對(duì)普通表的記錄做了改動(dòng)需要分配Undo頁(yè)面鏈表時(shí)，必須從這一類的段中分配相應(yīng)的undo slot。

第1～32號(hào)回滾段屬于一類。這些回滾段必須在臨時(shí)表空間（對(duì)應(yīng)著數(shù)據(jù)目錄中的ibtmp1文件）中。

如果一個(gè)事務(wù)在執(zhí)行過程中由于對(duì)臨時(shí)表的記錄做了改動(dòng)需要分配Undo頁(yè)面鏈表時(shí)，必須從這一類的段中分配相應(yīng)的undo slot。

也就是說如果一個(gè)事務(wù)在執(zhí)行過程中既對(duì)普通表的記錄做了改動(dòng)，又對(duì)臨時(shí)表的記錄做了改動(dòng)，那么需要為這個(gè)記錄分配2個(gè)回滾段，再分別到這兩個(gè)回滾段中分配對(duì)應(yīng)的undo slot。

不知道大家有沒有疑惑，為啥要把針對(duì)普通表和臨時(shí)表來劃分不同種類的回滾段呢？這個(gè)還得從Undo頁(yè)面本身說起，我們說Undo頁(yè)面其實(shí)是類型為FIL_PAGE_UNDO_LOG的頁(yè)面的簡(jiǎn)稱，說到底它也是一個(gè)普通的頁(yè)面。我們前邊說過，在修改頁(yè)面之前一定要先把對(duì)應(yīng)的redo日志寫上，這樣在系統(tǒng)奔潰重啟時(shí)才能恢復(fù)到奔潰前的狀態(tài)。我們向Undo頁(yè)面寫入undo日志本身也是一個(gè)寫頁(yè)面的過程，InnoDB為此還設(shè)計(jì)了許多種redo日志的類型，比方說MLOG_UNDO_HDR_CREATE、MLOG_UNDO_INSERT、MLOG_UNDO_INIT等等，也就是說我們對(duì)Undo頁(yè)面做的任何改動(dòng)都會(huì)記錄相應(yīng)類型的redo日志。但是對(duì)于臨時(shí)表來說，因?yàn)樾薷呐R時(shí)表而產(chǎn)生的undo日志只需要在系統(tǒng)運(yùn)行過程中有效，如果系統(tǒng)奔潰了，那么在重啟時(shí)也不需要恢復(fù)這些undo日志所在的頁(yè)面，所以在寫針對(duì)臨時(shí)表的Undo頁(yè)面時(shí)，并不需要記錄相應(yīng)的redo日志?？偨Y(jié)一下針對(duì)普通表和臨時(shí)表劃分不同種類的回滾段的原因：在修改針對(duì)普通表的回滾段中的Undo頁(yè)面時(shí)，需要記錄對(duì)應(yīng)的redo日志，而修改針對(duì)臨時(shí)表的回滾段中的Undo頁(yè)面時(shí)，不需要記錄對(duì)應(yīng)的redo日志。

小提士：
如果我們僅僅對(duì)普通表的記錄做了改動(dòng)，那么只會(huì)為該事務(wù)分配針對(duì)普通表的回滾段，不分配針對(duì)臨時(shí)表的回滾段。但是如果我們僅僅對(duì)臨時(shí)表的記錄做了改動(dòng)，那么既會(huì)為該事務(wù)分配針對(duì)普通表的回滾段，又會(huì)為其分配針對(duì)臨時(shí)表的回滾段（不過分配了回滾段并不會(huì)立即分配undo slot，只有在真正需要Undo頁(yè)面鏈表時(shí)才會(huì)去分配回滾段中的undo slot）。

9.5 為事務(wù)分配Undo頁(yè)面鏈表詳細(xì)過程

上邊說了一大堆的概念，大家應(yīng)該有一點(diǎn)點(diǎn)的小暈，接下來我們以事務(wù)對(duì)普通表的記錄做改動(dòng)為例，給大家梳理一下事務(wù)執(zhí)行過程中分配Undo頁(yè)面鏈表時(shí)的完整過程，

事務(wù)在執(zhí)行過程中對(duì)普通表的記錄首次做改動(dòng)之前，首先會(huì)到系統(tǒng)表空間的第5號(hào)頁(yè)面中分配一個(gè)回滾段（其實(shí)就是獲取一個(gè)Rollback Segment Header頁(yè)面的地址）。一旦某個(gè)回滾段被分配給了這個(gè)事務(wù)，那么之后該事務(wù)中再對(duì)普通表的記錄做改動(dòng)時(shí)，就不會(huì)重復(fù)分配了。

使用傳說中的round-robin（循環(huán)使用）方式來分配回滾段。比如當(dāng)前事務(wù)分配了第0號(hào)回滾段，那么下一個(gè)事務(wù)就要分配第33號(hào)回滾段，下下個(gè)事務(wù)就要分配第34號(hào)回滾段，簡(jiǎn)單一點(diǎn)的說就是這些回滾段被輪著分配給不同的事務(wù)（就是這么簡(jiǎn)單粗暴，沒啥好說的）。

在分配到回滾段后，首先看一下這個(gè)回滾段的兩個(gè)cached鏈表有沒有已經(jīng)緩存了的undo slot，比如如果事務(wù)做的是INSERT操作，就去回滾段對(duì)應(yīng)的insert undo cached鏈表中看看有沒有緩存的undo slot；如果事務(wù)做的是DELETE操作，就去回滾段對(duì)應(yīng)的update undo cached鏈表中看看有沒有緩存的undo slot。如果有緩存的undo slot，那么就把這個(gè)緩存的undo slot分配給該事務(wù)。
如果沒有緩存的undo slot可供分配，那么就要到Rollback Segment Header頁(yè)面中找一個(gè)可用的undo slot分配給當(dāng)前事務(wù)。

從Rollback Segment Header頁(yè)面中分配可用的undo slot的方式我們上邊也說過了，就是從第0個(gè)undo slot開始，如果該undo slot的值為FIL_NULL，意味著這個(gè)undo slot是空閑的，就把這個(gè)undo slot分配給當(dāng)前事務(wù)，否則查看第1個(gè)undo slot是否滿足條件，依次類推，直到最后一個(gè)undo slot。如果這1024個(gè)undo slot都沒有值為FIL_NULL的情況，就直接報(bào)錯(cuò)嘍（一般不會(huì)出現(xiàn)這種情況）～

找到可用的undo slot后，如果該undo slot是從cached鏈表中獲取的，那么它對(duì)應(yīng)的Undo Log Segment已經(jīng)分配了，否則的話需要重新分配一個(gè)Undo Log Segment，然后從該Undo Log Segment中申請(qǐng)一個(gè)頁(yè)面作為Undo頁(yè)面鏈表的first undo page。
然后事務(wù)就可以把undo日志寫入到上邊申請(qǐng)的Undo頁(yè)面鏈表了！

對(duì)臨時(shí)表的記錄做改動(dòng)的步驟和上述的一樣，就不贅述了。不過需要再次強(qiáng)調(diào)一次，如果一個(gè)事務(wù)在執(zhí)行過程中既對(duì)普通表的記錄做了改動(dòng)，又對(duì)臨時(shí)表的記錄做了改動(dòng)，那么需要為這個(gè)記錄分配2個(gè)回滾段。并發(fā)執(zhí)行的不同事務(wù)其實(shí)也可以被分配相同的回滾段，只要分配不同的undo slot就可以了。

9.6 回滾段相關(guān)配置

9.6.1 配置回滾段數(shù)量

我們前邊說系統(tǒng)中一共有128個(gè)回滾段，其實(shí)這只是默認(rèn)值，我們可以通過啟動(dòng)參數(shù)innodb_rollback_segments來配置回滾段的數(shù)量，可配置的范圍是1~128。但是這個(gè)參數(shù)并不會(huì)影響針對(duì)臨時(shí)表的回滾段數(shù)量，針對(duì)臨時(shí)表的回滾段數(shù)量一直是32，也就是說：

如果我們把innodb_rollback_segments的值設(shè)置為1，那么只會(huì)有1個(gè)針對(duì)普通表的可用回滾段，但是仍然有32個(gè)針對(duì)臨時(shí)表的可用回滾段。
如果我們把innodb_rollback_segments的值設(shè)置為2～33之間的數(shù)，效果和將其設(shè)置為1是一樣的。
如果我們把innodb_rollback_segments設(shè)置為大于33的數(shù)，那么針對(duì)普通表的可用回滾段數(shù)量就是該值減去32。

9.6.2 配置undo表空間

默認(rèn)情況下，針對(duì)普通表設(shè)立的回滾段（第0號(hào)以及第33~127號(hào)回滾段）都是被分配到系統(tǒng)表空間的。其中的第0號(hào)回滾段是一直在系統(tǒng)表空間的，但是第33~127號(hào)回滾段可以通過配置放到自定義的undo表空間中。但是這種配置只能在系統(tǒng)初始化（創(chuàng)建數(shù)據(jù)目錄時(shí)）的時(shí)候使用，一旦初始化完成，之后就不能再次更改了。我們看一下相關(guān)啟動(dòng)參數(shù)：

通過innodb_undo_directory指定undo表空間所在的目錄，如果沒有指定該參數(shù)，則默認(rèn)undo表空間所在的目錄就是數(shù)據(jù)目錄。
通過innodb_undo_tablespaces定義undo表空間的數(shù)量。該參數(shù)的默認(rèn)值為0，表明不創(chuàng)建任何undo表空間。

第33~127號(hào)回滾段可以平均分布到不同的undo表空間中。

小提士：
如果我們?cè)谙到y(tǒng)初始化的時(shí)候指定了創(chuàng)建了undo表空間，那么系統(tǒng)表空間中的第0號(hào)回滾段將處于不可用狀態(tài)。

比如我們?cè)谙到y(tǒng)初始化時(shí)指定的innodb_rollback_segments為35，innodb_undo_tablespaces為2，這樣就會(huì)將第33、34號(hào)回滾段分別分布到一個(gè)undo表空間中。

設(shè)立undo表空間的一個(gè)好處就是在undo表空間中的文件大到一定程度時(shí)，可以自動(dòng)的將該undo表空間截?cái)?/code>（truncate）成一個(gè)小文件。而系統(tǒng)表空間的大小只能不斷的增大，卻不能截?cái)唷?/p>

`總結(jié)`


到此這篇關(guān)于一篇文章帶你了解MySQL之undo日志的文章就介紹到這了,更多相關(guān)MySQL undo日志內(nèi)容請(qǐng)搜索腳本之家以前的文章或繼續(xù)瀏覽下面的相關(guān)文章希望大家以后多多支持腳本之家！
                            
                            
                                您可能感興趣的文章:MySQL回滾日志(undo?log)的作用和使用詳解
詳解MySQL 重做日志（redo log）與回滾日志（undo logo）
MySQL中的redo log和undo log日志詳解
MySQL中的undo日志
MySQL 撤銷日志與重做日志(Undo Log與Redo Log)相關(guān)總結(jié)
MySQL事務(wù)日志(redo?log和undo?log)的詳細(xì)分析
mysql日志文件之undo?log和redo?log
MySQL Redo與Undo日志詳細(xì)解析


                        
                        
                            
                        
                        
                            
                            
                                mysql
undo
日志

                            
                        
                        
                            
                        
                        
                        
                            相關(guān)文章
                            
  一條SQL更新語(yǔ)句的執(zhí)行過程解析
這篇文章主要介紹了一條SQL更新語(yǔ)句的執(zhí)行過程解析，所以一條更新語(yǔ)句的執(zhí)行流程又是怎樣的呢？下面我們一起進(jìn)入文章了解更多具體內(nèi)容吧
 2022-05-05 
  Sql在多張表中檢索數(shù)據(jù)的方法詳解
SELECT語(yǔ)句是SQL中最常用的語(yǔ)句。它的用途是從一個(gè)或多個(gè)表中檢索信息。為了使用SELECT檢索表數(shù)據(jù)，必須至少給出兩條信息：想選擇什么、從什么地方選擇
 2023-02-02 
  Mysql的基本函數(shù)與自定義函數(shù)用法
這篇文章主要介紹了Mysql的基本函數(shù)與自定義函數(shù)用法,具有很好的參考價(jià)值,希望對(duì)大家有所幫助,如有錯(cuò)誤或未考慮完全的地方,望不吝賜教
 2024-06-06 
  Centos8安裝mysql8的詳細(xì)過程(免安裝版/或者二進(jìn)制包方式安裝)
這篇文章主要介紹了Centos8安裝mysql8的詳細(xì)過程(免安裝版/或者二進(jìn)制包方式安裝),使用二進(jìn)制包方式安裝首先檢查服務(wù)器上是否安裝有mysql然后開始安裝配置，本文分步驟給大家講解的非常詳細(xì)，需要的朋友可以參考下
 2022-11-11 
  MySQL中distinct和group?by去重效率區(qū)別淺析
distinct 與 group by均可用于去重,下面這篇文章主要給大家介紹了關(guān)于MySQL中distinct和group?by去重效率區(qū)別的相關(guān)資料,文中介紹的非常詳細(xì),需要的朋友可以參考下
 2023-03-03 
  MySQL外鍵類型及應(yīng)用場(chǎng)景總結(jié)
這篇文章主要介紹了?MySQL?外鍵的類型（RESTRICT、CASCADE、SET?NULL、NO?ACTION）及其應(yīng)用場(chǎng)景、優(yōu)缺點(diǎn)和使用注意事項(xiàng),通過創(chuàng)建和測(cè)試外鍵,闡述了不同類型外鍵在主表刪除或更新數(shù)據(jù)時(shí)子表的變化,需要的朋友可以參考下
 2024-12-12 
  MySQL分區(qū)表的基本入門教程
這篇文章主要給大家介紹了關(guān)于MySQL分區(qū)表的基本入門教程，文中通過示例代碼介紹的非常詳細(xì)，對(duì)大家學(xué)習(xí)或者使用MySQL具有一定的參考學(xué)習(xí)價(jià)值，需要的朋友們下面來一起學(xué)習(xí)學(xué)習(xí)吧
 2020-05-05 
  MySQL啟動(dòng)失敗之MySQL服務(wù)無法啟動(dòng)的原因及解決
這篇文章主要介紹了MySQL啟動(dòng)失敗之MySQL服務(wù)無法啟動(dòng)的原因及解決，具有很好的參考價(jià)值，希望對(duì)大家有所幫助。如有錯(cuò)誤或未考慮完全的地方，望不吝賜教
 2022-12-12 
  mysql增量備份及斷點(diǎn)恢復(fù)腳本實(shí)例
生產(chǎn)環(huán)境中在mysql中誤操作是非常正常的，所以就需要用到mysql的增量備份恢復(fù)。增量備份是我們經(jīng)常用到的，它可以指定某個(gè)誤操作的時(shí)間以及位置點(diǎn)進(jìn)行數(shù)據(jù)恢復(fù),更加準(zhǔn)確的恢復(fù)我們想要還原的數(shù)據(jù)。
 2018-09-09 
  mysql8.0.18下安裝winx64的詳細(xì)教程(圖文詳解)
這篇文章主要介紹了安裝mysql-8.0.18-win-x64的詳細(xì)教程，本文圖文并茂給大家介紹的非常詳細(xì)，具有一定的參考借鑒價(jià)值,需要的朋友可以參考下
 2019-11-11 

                        
                        
                            
                        
                        
                        
                            最新評(píng)論


                

                
                    
                        
                        
                        
                        
                            
                                大家感興趣的內(nèi)容
                                
                                    1mysql安裝圖解 mysql圖文安裝教程(詳細(xì)說明)
2Can't connect t
3windows下MySQL5.6版本安裝及配置過程附有截圖和
4mysql之TIMESTAMP（時(shí)間戳）用法詳解
5Mysql字符串截取函數(shù)SUBSTRING的用法說明
6MySQL提示:The server q
7MySQL創(chuàng)建用戶與授權(quán)方法
8Mysql查看版本號(hào)的幾種方式
9MySQL——修改root密碼的4種方法(以windows為
10MySQL日期數(shù)據(jù)類型、時(shí)間類型使用總結(jié)
                                
                            
                        
                        
                        
                            
                                最近更新的內(nèi)容
                                
                                    MySQL數(shù)據(jù)庫(kù)innodb啟動(dòng)失敗無法重啟的解決方法
MySQL數(shù)據(jù)庫(kù)遠(yuǎn)程訪問權(quán)限設(shè)置方式
圖解MySQL中樂觀鎖扣減庫(kù)存原理
MySQL存儲(chǔ)引擎總結(jié)
CentOS 6.5 i386 安裝MySQL 5.7.18詳細(xì)教程
通過案例分析MySQL中令人頭疼的Aborted告警
mysql存儲(chǔ)過程之錯(cuò)誤處理實(shí)例詳解
MySQL配置文件無法修改的解決方法(Win10)
MySQL中l(wèi)ower_case_table_names作用及使用小結(jié)
mysql分配root賬號(hào)創(chuàng)建數(shù)據(jù)庫(kù)的權(quán)限的實(shí)現(xiàn)
                                
                            
                        
                        
                            
                        
                        
                            
                                常用在線小工具

欧美bbbwbbbw肥妇,免费乱码人妻系列日韩,一级黄片

一篇文章帶你了解MySQL之undo日志

目錄

一、事務(wù)回滾的需求

二、事務(wù)id

2.1 給事務(wù)分配id的時(shí)機(jī)

2.2 事務(wù)id是怎么生成的

2.3 trx_id隱藏列

三、undo日志的格式

3.1 INSERT操作對(duì)應(yīng)的undo日志

3.2 DELETE操作對(duì)應(yīng)的undo日志

3.3 UPDATE操作對(duì)應(yīng)的undo日志

3.3.1 不更新主鍵的情況

3.3.2 更新主鍵的情況

四、通用鏈表結(jié)構(gòu)

五、 FIL_PAGE_UNDO_LOG頁(yè)面

六、Undo頁(yè)面鏈表