MySQL使用binlog2sql工具實現(xiàn)在線恢復數(shù)據(jù)功能
背景
生產(chǎn)數(shù)據(jù)庫執(zhí)行 SQL 腳本,一般會經(jīng)過正規(guī)的審批流程才能運行。但有些情況是例外的,業(yè)務部門在提出一些刪除數(shù)據(jù)的需求后打算撤回,或者在運營后臺不小心刪除了一些數(shù)據(jù),然后找到 DBA 團隊協(xié)助,希望能恢復數(shù)據(jù)。
經(jīng)調(diào)研,binlog2sql 是大眾點評開源的一款用于解析 MySQL binlog 的工具,根據(jù)不同選項,可以得到原始SQL、回滾SQL、去除主鍵的INSERT SQL 等,適用于數(shù)據(jù)快速回滾(閃回)和主從切換后新 Master 丟數(shù)據(jù)的修復工作。
目標
驗證 binlog2sql 工具是否可以快速恢復數(shù)據(jù)。
步驟
準備工作
安裝 binlog2sql 工具。
> git clone https://github.com/danfengcao/binlog2sql.git && cd binlog2sql # > yum install python3-pip # > whereis pip # > pip3.6 install -r requirements.txt > pip install -r requirements.txt
MySQL 服務端配置以下參數(shù),請注意,binlog2sql 僅支持 row 格式。
[mysqld] server_id = 1 log_bin = /var/log/mysql/mysql-bin.log max_binlog_size = 1G binlog_format = row binlog_row_image = full
指定執(zhí)行腳本的數(shù)據(jù)庫用戶授權。
-- SELECT 權限:查詢 information_schema.COLUMNS -- REPLICATION SLAVE:通過 BINLOG_DUMP 協(xié)議獲取 binlog 內(nèi)容 -- REPLICATION CLIENT:執(zhí)行 SHOW MASTER STATUS 獲取 binlog 信息 GRANT SELECT, REPLICATION SLAVE, REPLICATION CLIENT ON *.* TO user
準備一張用戶表 user,并填充 1W 條數(shù)據(jù)。
CREATE TABLE `user` ( `id` int(11) NOT NULL AUTO_INCREMENT, `name` varchar(10) DEFAULT NULL, `gmt_create` date DEFAULT NULL, PRIMARY KEY (`id`) ) ENGINE=InnoDB AUTO_INCREMENT=1 DEFAULT CHARSET=utf8mb4 DELIMITER $$ CREATE PROCEDURE InsertRandomData() BEGIN DECLARE i INT DEFAULT 1; DECLARE randomName CHAR(10); DECLARE randomDate DATE; WHILE i <= 10000 DO -- 生成隨機 name (隨機字符串) SET randomName = CONCAT( CHAR(FLOOR(RAND() * 26) + 65), CHAR(FLOOR(RAND() * 26) + 65), CHAR(FLOOR(RAND() * 26) + 65), CHAR(FLOOR(RAND() * 26) + 65), CHAR(FLOOR(RAND() * 26) + 65) ); -- 生成隨機日期 (2013-11-11 起始,隨機范圍約為一年內(nèi)) SET randomDate = DATE_ADD('2023-01-01', INTERVAL FLOOR(RAND() * 365) DAY); -- 插入數(shù)據(jù) INSERT INTO `user` (`name`, `gmt_create`) VALUES (randomName, randomDate); SET i = i + 1; END WHILE; END$$ DELIMITER ; -- 調(diào)用存儲過程 CALL InsertRandomData();
查看大于 11 月份的數(shù)據(jù)總數(shù),共 363 條。
mysql > SELECT count(*) FROM user WHERE gmt_create > '2023-11-01 00:00:00'; +----------+ | count(*) | +----------+ | 363 | +----------+
模擬誤刪除,假設在 15:30 左右刪除了 11 月份之后的數(shù)據(jù)。
mysql > DELETE FROM user WHERE gmt_create > '2023-11-01 00:00:00';
恢復數(shù)據(jù)
查看主庫 binlog 狀態(tài),最新的文件為 mysql-bin.000003。
-- 低版本使用 SHOW MASTER STATUS; mysql > SHOW BINARY LOGS; +------------------+-----------+-----------+ | Log_name | File_size | Encrypted | +------------------+-----------+-----------+ | mysql-bin.000001 | 1871 | No | | mysql-bin.000002 | 181 | No | | mysql-bin.000003 | 917878 | No | +------------------+-----------+-----------+ 3 rows in set (0.04 sec)
篩選出需要回滾的SQL,誤操作人一般知道大致的誤操作時間,我們首先根據(jù)時間做一次過濾。
shell> python binlog2sql/binlog2sql.py -h地址 -P端口 -u用戶 -p'密碼' -d庫民 -t表名 --start-file='mysql-bin.000003' --start-datetime='2023-11-02 15:00:00' --stop-datetime='2023-11-02 16:00:00' > /tmp/raw.sql
raw.sql輸出:
DELETE FROM `test`.`user` WHERE `gmt_create`='2023-11-01 00:00:00' AND `id`=1351 AND `name`='TPUDJ' LIMIT 1; #start 105311 end 262311 time 2023-11-02 15:31:10
DELETE FROM `test`.`user` WHERE `gmt_create`='2023-11-01 00:00:00' AND `id`=1352 AND `name`='YKIIS' LIMIT 1; #start 105311 end 262311 time 2023-11-02 15:31:10
...
DELETE FROM `test`.`user` WHERE `gmt_create`='2023-12-31 00:00:00' AND `id`=1714 AND `name`='SHKBC' LIMIT 1; #start 105311 end 265754 time 2023-11-02 15:31:10
根據(jù) raw.sql 的位置信息,可以判斷誤操作的 SQL 來自同一個事務,準確位置在 105311-265754 之間,根據(jù)位置過濾,使用 -B 選項生成回滾 SQL。
shell> python binlog2sql/binlog2sql.py -h地址 -P端口 -u用戶 -p'密碼' -d庫民 -t表名 --start-file='mysql-bin.000003' --start-position=105311 --stop-position=265754 -B > /tmp/rollback.sql
rollback.sql輸出:
INSERT INTO `test`.`user`(`gmt_create`, `id`, `name`) VALUES ('2023-11-01 00:00:00', 1351, 'TPUDJ'); #start 105311 end 262311 time 2023-11-02 15:31:10
INSERT INTO `test`.`user`(`gmt_create`, `id`, `name`) VALUES ('2023-11-01 00:00:00', 1352, 'YKIIS'); #start 105311 end 262311 time 2023-11-02 15:31:10
...
INSERT INTO `test`.`user`(`gmt_create`, `id`, `name`) VALUES ('2023-12-31 00:00:00', 1714, 'SHKBC'); #start 105311 end 265754 time 2023-11-02 15:31:10
結果驗證
確認回滾 SQL 總行數(shù)是否對應誤刪除的 363 條。
shell> wc -l /tmp/rollback.sql
363 /tmp/rollback.sql
與業(yè)務方確認回滾 SQL 沒問題,執(zhí)行回滾語句。登錄 MySQL,確認回滾成功。
shell> mysql -h地址 -P端口 -u用戶 -p'密碼' < /tmp/rollback.sql mysql> SELECT count(*) FROM user WHERE gmt_create > '2023-11-01 00:00:00'; +----------+ | count(*) | +----------+ | 363 | +----------+
結論
binlog2sql 適用于在線恢復誤操作的數(shù)據(jù),但不適用于以下情況:
- 數(shù)據(jù)恢復建議控制在 50W 以內(nèi),數(shù)據(jù)量越大,逆向生成的語句越多,超過這個數(shù)值,恢復時間可能會超過 15 分鐘。
- 不支持 DDL 恢復操作。因為即使在 row 模式下,binlog對于 DDL 操作不會記錄每行數(shù)據(jù)的變化。要實現(xiàn) DDL 快速回滾,必須修改 MySQL 源碼,使得在執(zhí)行 DDL 前先備份老數(shù)據(jù)。阿里林曉斌團隊提交了 patch 給 MySQL 官方,相關實現(xiàn)方案可以查閱 MySQL閃回方案討論及實現(xiàn)。
- 根據(jù)官方說法,在線召回數(shù)據(jù)推薦使用 binlog2sql 工具,離線解析使用 mysqlbinlog 工具,MySQL 閃回特性最早由阿里彭立勛開發(fā)。
到此這篇關于MySQL使用binlog2sql工具實現(xiàn)在線恢復數(shù)據(jù)功能的文章就介紹到這了,更多相關MySQL binlog2sql恢復數(shù)據(jù)內(nèi)容請搜索腳本之家以前的文章或繼續(xù)瀏覽下面的相關文章希望大家以后多多支持腳本之家!
相關文章
MySQL制作具有千萬條測試數(shù)據(jù)的測試庫的方法
這篇文章主要介紹了MySQL制作具有千萬條測試數(shù)據(jù)的測試庫的方法,幫助大家更好的理解和學習MySQL,感興趣的朋友可以了解下2020-11-11在MySQL中實現(xiàn)基于時間點的數(shù)據(jù)恢復
在MySQL中實現(xiàn)基于時間點的數(shù)據(jù)恢復是一個復雜但可行的過程,主要依賴于MySQL的二進制日志(Binary Log),本文介紹了實現(xiàn)此功能的一般步驟,并有詳細的代碼供大家參考,需要的朋友可以參考下2024-03-03mysql啟動時出現(xiàn)ERROR 2003 (HY000)問題的解決方法
這篇文章主要為大家詳細介紹了mysql啟動時出現(xiàn)ERROR 2003 (HY000問題的解決方法,具有一定的參考價值,感興趣的小伙伴們可以參考一下2018-03-03從ibd文件恢復MySQL數(shù)據(jù)的操作步驟及常見錯誤
MySQL數(shù)據(jù)恢復是數(shù)據(jù)庫管理中的一項重要任務,尤其是在遭遇意外數(shù)據(jù)丟失、硬件故障或軟件錯誤時,下面這篇文章主要給大家介紹了關于從ibd文件恢復MySQL數(shù)據(jù)的操作步驟及常見錯誤,需要的朋友可以參考下2024-08-08