一文搞懂MySQL元數(shù)據(jù)鎖(MDL)

更新時間：2022年09月16日 15:12:10 作者：京東云開發(fā)者

這篇文章主要為大家詳細(xì)介紹了MySQL中元數(shù)據(jù)鎖(MDL)的相關(guān)資料，文中的示例代碼講解詳細(xì)，對我們學(xué)習(xí)有一定的借鑒價值，需要的可以參考一下

某日，路上收到用戶咨詢，為了清除空間，想刪除某200多G大表數(shù)據(jù)，且已經(jīng)確認(rèn)此表不再有業(yè)務(wù)訪問，于是執(zhí)行了一條命令‘delete from bigtable’，但好長時間也沒刪完，經(jīng)過咨詢后，獲知drop table刪除表速度快，而且能徹底釋放空間，于是又在另外一個session中執(zhí)行了‘drop table bigtable’命令，但是這個命令并沒有快速返回結(jié)果，光標(biāo)一直hang在原地不動。最后找我們協(xié)助，在登錄數(shù)據(jù)庫執(zhí)行‘show processlist’后發(fā)現(xiàn)drop語句的狀態(tài)是‘waiting for table metadata lock’，而之前執(zhí)行的另外一個delete語句依舊能看到，狀態(tài)為‘updating’，截圖如下：

到底什么是metadata lock？這個鎖等待是如何產(chǎn)生的？會帶來什么影響？最后又如何來解決？今天我們挑6個常見問題給大家解答一下。

一、什么是metadata lock

在MySQL5.5.3之前，有一個著名的bug#989，大致如下:

 session1:  
 BEGIN;
 INSERT INTO t ... ;
 COMMIT;  

 session2:  
 DROP TABLE t;

然而上面的操作流程在binlog記錄的順序是

 DROP TABLE t; 
 BEGIN;  
 INSERT INTO t ... ; 
 COMMIT;

很顯然備庫執(zhí)行binlog時會先刪除表t，然后執(zhí)行insert 會報(bào)1032 error，導(dǎo)致復(fù)制中斷。為了解決該bug,MySQL 在5.5.3引入了MDL鎖（metadata lock），來保護(hù)表的元數(shù)據(jù)信息，用于解決或者保證DDL操作與DML操作之間的一致性。

再舉一個簡單的例子，如果你在查詢一個表的過程中，另外一個session對該表刪除了一個列，那前面的查詢到底該顯示什么呢？如果在RR隔離級別下，事物中再次執(zhí)行相同的語句還會和之前結(jié)果一致嗎？為了防止這種情況，表查詢開始MySQL會在表上加一個鎖，來防止被別的session修改了表定義，這個鎖就叫‘metadata lock’，簡稱MDL，翻譯成中文也叫‘元數(shù)據(jù)鎖’。

二、MDL和行鎖有什么區(qū)別

metadata lock是表級鎖，是在server層加的，適用于所有存儲引擎。所有的dml操作都會在表上加一個metadata讀鎖；所有的ddl操作都會在表上加一個metadata寫鎖。讀鎖和寫鎖的阻塞關(guān)系如下：

讀鎖和寫鎖之間相互阻塞，即同一個表上的dml和ddl之間互相阻塞。
寫鎖和寫鎖之間互相阻塞，即兩個session不能對表同時做表定義變更，需要串行操作。
讀鎖和讀鎖之間不會產(chǎn)生阻塞。也就是增刪改查不會因?yàn)閙etadata lock產(chǎn)生阻塞，可以并發(fā)執(zhí)行，日常工作中大家看到的dml之間的鎖等待是innodb行鎖引起的，和metadata lock無關(guān)。

熟悉innodb行鎖的同學(xué)這里可能有點(diǎn)困惑，因?yàn)樾墟i分類和metadata lock很類似，也主要分為讀鎖和寫鎖，或者叫共享鎖和排他鎖，讀寫鎖之間阻塞關(guān)系也一致。二者最重要的區(qū)別一個是表鎖，一個是行鎖，且行鎖中的讀寫操作對應(yīng)在metadata lock中都屬于讀鎖。

大家也許會奇怪，以前聽說普通查詢不加鎖的，怎么這里又說要加表鎖，我們做一個簡單測試：

session1：查詢前，先看一下metadata_locks表，這個表位于performance_schema下，記錄了metadata lock的加鎖信息。

mysql> select * from performance_schema.metadata_locks ;
+-------------+--------------------+----------------+-------------+-----------------------+-------------+---------------+-------------+-------------------+-----------------+----------------+
| OBJECT_TYPE | OBJECT_SCHEMA      | OBJECT_NAME    | COLUMN_NAME | OBJECT_INSTANCE_BEGIN | LOCK_TYPE   | LOCK_DURATION | LOCK_STATUS | SOURCE            | OWNER_THREAD_ID | OWNER_EVENT_ID |
+-------------+--------------------+----------------+-------------+-----------------------+-------------+---------------+-------------+-------------------+-----------------+----------------+
| TABLE       | performance_schema | metadata_locks | NULL        |       139776223308432 | SHARED_READ | TRANSACTION   | GRANTED     | sql_parse.cc:6014 |              54 |             12 |
+-------------+--------------------+----------------+-------------+-----------------------+-------------+---------------+-------------+-------------------+-----------------+----------------+
1 row in set (0.00 sec)

session2：執(zhí)行簡單查詢，為了讓表處于執(zhí)行狀態(tài)，這里使用了sleep函數(shù)。

mysql> select sleep(10) from t1;
+-----------+
| sleep(10) |
+-----------+
|         0 |
|         0 |
|         0 |
+-----------+
3 rows in set (30.00 sec)

session1：

mysql> select * from performance_schema.metadata_locks ;
+-------------+--------------------+----------------+-------------+-----------------------+-------------+---------------+-------------+-------------------+-----------------+----------------+
| OBJECT_TYPE | OBJECT_SCHEMA      | OBJECT_NAME    | COLUMN_NAME | OBJECT_INSTANCE_BEGIN | LOCK_TYPE   | LOCK_DURATION | LOCK_STATUS | SOURCE            | OWNER_THREAD_ID | OWNER_EVENT_ID |
+-------------+--------------------+----------------+-------------+-----------------------+-------------+---------------+-------------+-------------------+-----------------+----------------+
| TABLE       | db1                | t1             | NULL        |       139776154308336 | SHARED_READ | TRANSACTION   | GRANTED     | sql_parse.cc:6014 |              53 |             22 |
| TABLE       | performance_schema | metadata_locks | NULL        |       139776223308432 | SHARED_READ | TRANSACTION   | GRANTED     | sql_parse.cc:6014 |              54 |             13 |
+-------------+--------------------+----------------+-------------+-----------------------+-------------+---------------+-------------+-------------------+-----------------+----------------+
2 rows in set (0.00 sec)

此時再次查看metadata_lock表，發(fā)現(xiàn)多了一條t1的加鎖記錄，加鎖類型為SHARED_READ,且狀態(tài)是已授予（GRANTED)。大家通常理解的查詢不加鎖，是指不在表上加innodb行鎖。

如果在執(zhí)行sleep期間，另外一個session執(zhí)行了一個加字段操作，此時就會產(chǎn)生metadata lock鎖等待：

session2:

mysql> select sleep(10) from t1;

執(zhí)行中......

session3：

mysql> alter table t1 add col1 int;

阻塞中......

session1:

mysql> show processlist;
+----+-----------------+-----------+------+---------+--------+---------------------------------+-----------------------------+
| Id | User            | Host      | db   | Command | Time   | State                           | Info                        |
+----+-----------------+-----------+------+---------+--------+---------------------------------+-----------------------------+
|  4 | event_scheduler | localhost | NULL | Daemon  | 861577 | Waiting on empty queue          | NULL                        |
| 18 | root            | localhost | db1  | Sleep   |     50 |                                 | NULL                        |
| 19 | root            | localhost | NULL | Query   |      0 | starting                        | show processlist            |
| 20 | root            | localhost | db1  | Query   |     11 | Waiting for table metadata lock | alter table t1 add col1 int |
+----+-----------------+-----------+------+---------+--------+---------------------------------+-----------------------------+
4 rows in set (0.00 sec)

顯然，id為20的線程還未執(zhí)行alter操作，狀態(tài)為‘Waiting for table metadata lock’，也就是在等待session2的sleep操作完成。

三、MDL為什么會造成系統(tǒng)崩潰

舉一個簡單例子:

session1啟動一個事務(wù)，對表t1執(zhí)行一個簡單的查詢；
session2對t1加一個字段；
session3來對t1做一個查詢；
session4來對t1做一個update;

各個session串行操作。

session1：

mysql> begin;
Query OK, 0 rows affected (0.00 sec)


mysql> select * from t1 where id=1;
+----+------+------+-------+
| id | name | age  | birth |
+----+------+------+-------+
|  1 | aa   |   10 | NULL  |
+----+------+------+-------+
1 row in set (0.00 sec)

session2：

mysql> alter table t1 add col1 int;

阻塞中...

session3:

mysql> select sleep(10) from t1 ;

阻塞中...

session4:

mysql> update t1 set name='aaaa' where id=2;

阻塞中...

也就是由于session1的一個事務(wù)沒有提交，導(dǎo)致session2的ddl操作被阻塞，session3和session4本身不會被session1阻塞，但由于在鎖隊(duì)列中，session2排隊(duì)更早，它準(zhǔn)備加的是metadata lock寫鎖，阻塞了session3和session4的讀鎖。如果t1是一個執(zhí)行頻繁的表，show processlist會發(fā)現(xiàn)大量‘waiting for table metadata lock’的線程，數(shù)據(jù)庫連接很快就會消耗完，導(dǎo)致業(yè)務(wù)系統(tǒng)無法正常響應(yīng)。

此時如果session1提交，是session2的alter語句先執(zhí)行還是session3和session4先執(zhí)行呢？之前一直以為先到的先執(zhí)行，當(dāng)然是session2先執(zhí)行，但經(jīng)過測試，在5.7中，session3和session4先執(zhí)行，session2最后執(zhí)行，也就會出現(xiàn)alter長時間無法執(zhí)行的情況；而在8.0中，session2先執(zhí)行，session3和session4后執(zhí)行，由于5.6以后ddl是online的，session2并不會阻塞session3和session4，感覺這樣才是合理的，alter不會被‘餓死’。

四、MDL的生命周期有多長

事務(wù)！事務(wù)！事務(wù)！ 重要的事情說三遍，表上的metadata lock的生命周期從事務(wù)中的第一條涉及自身的語句開始，到整個事務(wù)結(jié)束而結(jié)束。而5.5之前是基于語句的，事務(wù)中執(zhí)行完語句就釋放，如果此時另外一個session對表做了一個刪字段操作，那么就會造成兩個問題：

ddl操作如果先于事務(wù)完成，那么binlog中ddl就會排在事務(wù)之前，明顯和邏輯不符，觸發(fā)了本文開始提到的bug。
如果是RR隔離級別，那么事務(wù)中此表第二次執(zhí)行將無法返回同樣的結(jié)果，無法滿足可重復(fù)讀的要求。

所以，如果要降低metadata lock的鎖等待時間，最好要及時提交事務(wù)，同時盡量避免大事務(wù)。

那么如果發(fā)生metadata lock鎖等待，等待鎖的session會等待多長時間呢？大家都知道MySQL里面行鎖等待有個超時時間（參數(shù)innodb_lock_wait_timeout），默認(rèn)50s。metadata lock也有類似參數(shù)控制：

mysql> show variables like 'lock_wait_timeout'      ;
+-------------------+----------+
| Variable_name     | Value    |
+-------------------+----------+
| lock_wait_timeout | 31536000 |
+-------------------+----------+
1 row in set (0.00 sec)

這么長的數(shù)字，掰著指頭算了半天，居然真的是......一年，環(huán)游世界一圈回來還得接著等!!!

當(dāng)然，生產(chǎn)環(huán)境中，我們很少會等待metadata lock超時，更多的是要想辦法把產(chǎn)生metadata lock的源頭找到，快速提交或者回滾，或者想辦法kill掉。那么如何找到阻塞的源頭呢？

五、如何快速找到阻塞源頭

快速解決問題永遠(yuǎn)是第一位的，一旦出現(xiàn)長時間的metadata lock，尤其是在訪問頻繁的業(yè)務(wù)表上產(chǎn)生，通常會導(dǎo)致表無法訪問，讀寫全被阻塞，此時找到阻塞源頭是第一位的。這里最重要的表就是前面提到過的
performance_schema.metadata_locks表。

metadata_locks是5.7中被引入，記錄了metadata lock的相關(guān)信息，包括持有對象、類型、狀態(tài)等信息。但5.7默認(rèn)設(shè)置是關(guān)閉的（8.0默認(rèn)打開），需要通過下面命令打開設(shè)置：

UPDATE performance_schema.setup_instruments SET ENABLED = 'YES', TIMED = 'YES'WHERE NAME = 'wait/lock/metadata/sql/mdl';

如果要永久生效，需要在配置文件中加入如下內(nèi)容：

[mysqld]
performance-schema-instrument='wait/lock/metadata/sql/mdl=ON'

單純查詢這個表無法得出具體的阻塞關(guān)系，也無法得知什么語句造成的阻塞，這里要關(guān)聯(lián)另外兩個表performance_schema.thread和
performance_schema.events_statements_history,thread表可以將線程id和show processlist中id關(guān)聯(lián)，events_statements_history表可以得到事務(wù)的歷史sql，關(guān)聯(lián)后的完整sql如下：

SELECT
    locked_schema,
    locked_table,
    locked_type,
    waiting_processlist_id,
    waiting_age,
    waiting_query,
    waiting_state,
    blocking_processlist_id,
    blocking_age,
    substring_index(sql_text,"transaction_begin;" ,-1) AS blocking_query,
    sql_kill_blocking_connection
FROM
    (
        SELECT
            b.OWNER_THREAD_ID AS granted_thread_id,
            a.OBJECT_SCHEMA AS locked_schema,
            a.OBJECT_NAME AS locked_table,
            "Metadata Lock" AS locked_type,
            c.PROCESSLIST_ID AS waiting_processlist_id,
            c.PROCESSLIST_TIME AS waiting_age,
            c.PROCESSLIST_INFO AS waiting_query,
            c.PROCESSLIST_STATE AS waiting_state,
            d.PROCESSLIST_ID AS blocking_processlist_id,
            d.PROCESSLIST_TIME AS blocking_age,
            d.PROCESSLIST_INFO AS blocking_query,
            concat('KILL ', d.PROCESSLIST_ID) AS sql_kill_blocking_connection
        FROM
            performance_schema.metadata_locks a
        JOIN performance_schema.metadata_locks b ON a.OBJECT_SCHEMA = b.OBJECT_SCHEMA
        AND a.OBJECT_NAME = b.OBJECT_NAME
        AND a.lock_status = 'PENDING'
        AND b.lock_status = 'GRANTED'
        AND a.OWNER_THREAD_ID <> b.OWNER_THREAD_ID
        AND a.lock_type = 'EXCLUSIVE'
        JOIN performance_schema.threads c ON a.OWNER_THREAD_ID = c.THREAD_ID
        JOIN performance_schema.threads d ON b.OWNER_THREAD_ID = d.THREAD_ID
    ) t1,
    (
        SELECT
            thread_id,
            group_concat(   CASE WHEN EVENT_NAME = 'statement/sql/begin' THEN "transaction_begin" ELSE sql_text END ORDER BY event_id SEPARATOR ";" ) AS sql_text
        FROM
           performance_schema.events_statements_history
        GROUP BY thread_id
    ) t2
WHERE
    t1.granted_thread_id = t2.thread_id \G

對于前面的例子執(zhí)行此sql，得到一個清晰的阻塞關(guān)系：

               locked_schema: db1
                locked_table: t1
                 locked_type: Metadata Lock
      waiting_processlist_id: 28
                 waiting_age: 227
               waiting_query: alter table t1 add cl3 int
               waiting_state: Waiting for table metadata lock
     blocking_processlist_id: 27
                blocking_age: 252
              blocking_query: select * from t1
sql_kill_blocking_connection: KILL 27
1 row in set, 1 warning (0.00 sec)

根據(jù)顯示結(jié)果，processlist_id為27的線程阻塞了28的線程，我們需要kill 27即可解鎖。

實(shí)際上，MySQL也提供了一個類似的視圖來解決metadata lock問題，視圖名稱為sys.schema_table_lock_waits，但此視圖查詢結(jié)果有bug，不是很準(zhǔn)確，建議大家還是參考上面sql。

六、本文開始的案例最終如何解決

通過前面的介紹，本文開始的案例產(chǎn)生的過程就很簡單了：用戶執(zhí)行了一個全表delete，在目標(biāo)表上加了metadata讀鎖，由于表很大，讀鎖長時間無法釋放，后來另外一個session執(zhí)行了drop table操作，又需要在表上加metadata寫鎖，由于讀寫鎖互相阻塞，drop操作只能等待delete操作完成才能獲得寫鎖，因此從表面來看，二個命令都長時間沒有響應(yīng)，其實(shí)內(nèi)部一個在執(zhí)行，一個在等待。

那怎么來解決呢？因?yàn)閺膕how processlist以及客戶描述可以很清楚的知道故障機(jī)制，當(dāng)時建議客戶將delete操作kill掉，等數(shù)據(jù)回滾完后再執(zhí)行drop操作因?yàn)閐elete已經(jīng)執(zhí)行了一段時間，回滾過程可能會較長，客戶最終kill delete后順利drop成功。

小結(jié)

生產(chǎn)環(huán)境大多是dml操作，metadata讀鎖之間不會產(chǎn)生鎖等待，而目前MySQL的ddl操作大多可以online執(zhí)行，因此即使有寫鎖，也會很快降級為讀鎖，所以ddl執(zhí)行期間阻塞dml的幾率也很小。最容易出現(xiàn)的情況是由于有未完成的事務(wù)，導(dǎo)致ddl metadata 寫鎖無法加上，只能在鎖隊(duì)列等待，而一旦進(jìn)入鎖隊(duì)列，寫鎖又會阻塞其他的讀鎖，導(dǎo)致數(shù)據(jù)庫連接快速增長，直至消耗殆盡，最終業(yè)務(wù)受到影響。

為了盡可能避免類似問題，下面是幾個小建議：

生產(chǎn)環(huán)境的任何大表或頻繁操作的小表，ddl都要非常慎重，最好在業(yè)務(wù)低峰期執(zhí)行。
設(shè)計(jì)上要盡可能避免大事務(wù)，大事務(wù)不僅僅會帶來各種鎖問題，還好引起復(fù)制延遲/回滾空間爆滿等各類問題。
要及時提交事務(wù)，經(jīng)常發(fā)現(xiàn)客戶端設(shè)置了事務(wù)手工提交，但sql執(zhí)行后忘記點(diǎn)擊提交按鈕，導(dǎo)致事務(wù)長時間無法提交。建議監(jiān)控實(shí)例中的長事務(wù)，避免由于各種原因?qū)е率聞?wù)沒有及時提交。

到此這篇關(guān)于一文搞懂MySQL元數(shù)據(jù)鎖(MDL)的文章就介紹到這了,更多相關(guān)MySQL元數(shù)據(jù)鎖內(nèi)容請搜索腳本之家以前的文章或繼續(xù)瀏覽下面的相關(guān)文章希望大家以后多多支持腳本之家！

您可能感興趣的文章: