快捷導(dǎo)航

利用JuiceFS使MySQL?備份驗(yàn)證性能提升?10?倍

更新時(shí)間：2022年03月17日 09:28:49 作者：JuiceFS

這篇文章主要介紹了如何讓?MySQL?備份驗(yàn)證性能提升?10?倍，JuiceFS?非常適合用來(lái)做?MySQL?物理備份，通過(guò)不斷調(diào)整?XtraBackup?的參數(shù)和?JuiceFS?的掛載參數(shù)，在一個(gè)小時(shí)內(nèi)將時(shí)間縮短到原先的?1/10，下文一起來(lái)看相關(guān)內(nèi)容的詳細(xì)介紹吧

JuiceFS 非常適合用來(lái)做 MySQL 物理備份，具體使用參考官方文檔。在測(cè)試時(shí)，備份驗(yàn)證的數(shù)據(jù)準(zhǔn)備（xtrabackup --prepare）過(guò)程非常慢。我們借助 JuiceFS 提供的性能分析工具做了分析，快速發(fā)現(xiàn)性能瓶頸，通過(guò)不斷調(diào)整 XtraBackup 的參數(shù)和 JuiceFS 的掛載參數(shù)，在一個(gè)小時(shí)內(nèi)將時(shí)間縮短到原先的 1/10。本文將我們性能分析和優(yōu)化的過(guò)程記錄分享下來(lái)，給大家分析和優(yōu)化 IO 性能提供參考。

數(shù)據(jù)準(zhǔn)備

我們通過(guò) SysBench 工具生成一個(gè)大小 11GiB 左右的單表數(shù)據(jù)庫(kù)，數(shù)據(jù)庫(kù)表的 partition 設(shè)置成 10。為了模擬一個(gè)正常的數(shù)據(jù)庫(kù)讀寫(xiě)場(chǎng)景，通過(guò) SysBench 以秒 50 個(gè)請(qǐng)求的壓力訪問(wèn)數(shù)據(jù)庫(kù)，在該壓力下數(shù)據(jù)庫(kù)對(duì)數(shù)據(jù)盤(pán)造成的寫(xiě)數(shù)據(jù)在 8~10MiB/s 范圍內(nèi)。通過(guò)下列命令將數(shù)據(jù)庫(kù)備份到 JuiceFS 上。

# xtrabackup --backup --target-dir=/jfs/base/

為了保證每次數(shù)據(jù)準(zhǔn)備操作的數(shù)據(jù)完全一樣，使用 JuiceFS 的快照（snapshot）功能基于 /jfs/base 目錄生成快照 /jfs/base_snapshot/。每一次操作前都會(huì)將前一次數(shù)據(jù)準(zhǔn)備操作過(guò)的數(shù)據(jù)刪掉重新生成一個(gè)新的快照。

使用默認(rèn)參數(shù)

# ./juicefs mount volume-demoz /jfs

# ?time xtrabackup --prepare --apply-log-only --target-dir=/jfs/base_snapshot

執(zhí)行總耗時(shí)62秒。

JuiceFS支持導(dǎo)出操作日志 oplog，并能對(duì) oplog 進(jìn)行可視化展示。在執(zhí)行 xtrabackup --prepare操作之前我們新開(kāi)一個(gè)終端連接到該服務(wù)器，在命令行輸入

# cat /jfs/.oplog > oplog.txt

開(kāi)始搜集 oplog 日志，然后執(zhí)行 xtrabackup --prepare 操作，操作結(jié)束后將 oplog.txt 下載到本地，上傳到 JuiceFS 提供的 oplog 分析頁(yè)面：https://juicefs.com/oplog/。

我們將 oplog 進(jìn)行可視化展示

這里先大致介紹下這個(gè)圖中各種元素含義。我們的一條 oplog 中包含了時(shí)間戳，線程 ID，文件系統(tǒng)操作函數(shù)（read, write, fsync, flush 等），操作持續(xù)的時(shí)間等。左側(cè)數(shù)字表示線程 ID，橫軸表示時(shí)間，不同類型操作用不同顏色標(biāo)記。

我們把局部圖像放大，不同顏色代表不同類型的操作就一目了然。

排除掉與本次操作無(wú)關(guān)的幾個(gè)線程。在數(shù)據(jù)準(zhǔn)備過(guò)程中有 4 個(gè)線程負(fù)責(zé)讀，5 個(gè)線程負(fù)責(zé)寫(xiě)數(shù)據(jù)，讀寫(xiě)在時(shí)間上都是重疊的。

增大 XtraBackup 的內(nèi)存緩沖區(qū)

參考 XtraBackup 官方文檔，數(shù)據(jù)準(zhǔn)備是使用內(nèi)嵌的 InnoDB 在備份數(shù)據(jù)集上執(zhí)行故障修復(fù)（crash recovery）的過(guò)程。

使用 --use-memory 選項(xiàng)增大內(nèi)嵌 InnoDB 的內(nèi)存緩沖區(qū)大小，默認(rèn) 100MB，我們?cè)龃蟮?4GB。

# time xtrabackup --prepare --use-memory=4G --apply-log-only --target-dir=/jfs/base_snapshot

執(zhí)行時(shí)間降到了33秒。

可以看到讀寫(xiě)不重疊了，將數(shù)據(jù)讀到內(nèi)存處理完成后寫(xiě)入文件系統(tǒng)。

增大 XtraBackup 讀線程數(shù)

通過(guò)增大緩沖區(qū)將時(shí)間縮短了一半，整個(gè)讀的過(guò)程耗時(shí)依然比較明顯。我們看到每個(gè)讀線程基本都是跑滿的狀態(tài)，我們嘗試增加更多的讀線程。

# time xtrabackup --prepare --use-memory=4G --innodb-file-io-threads=16 --innodb-read-io-threads=16 --apply-log-only --target-dir=/jfs/base_snapshot

行時(shí)間降到了23秒。

讀線程已經(jīng)增加到了 16 個(gè)（默認(rèn) 4 個(gè)），讀操作降到 7 秒左右。

JuiceFS 啟用異步寫(xiě)

上一步我們極大的優(yōu)化了讀操作時(shí)間，現(xiàn)在寫(xiě)過(guò)程消耗的時(shí)間就比較明顯了。通過(guò)分析 oplog，發(fā)現(xiàn)寫(xiě)操作中 fsync 是不能并行的，因此增大寫(xiě)線程數(shù)并不能提升寫(xiě)的效率，在實(shí)際操作過(guò)程中我們也通過(guò)增大寫(xiě)線程數(shù)驗(yàn)證了這一點(diǎn)，這里就不贅述了。分析 oplog 對(duì)同一個(gè)文件（相同文件描述符）的寫(xiě)操作的參數(shù)（偏移，寫(xiě)數(shù)據(jù)大?。?，發(fā)現(xiàn)有大量的隨機(jī)寫(xiě)操作，我們可以在掛載 JuiceFS 時(shí)啟用 --writeback 選項(xiàng)，寫(xiě)數(shù)據(jù)時(shí)先寫(xiě)本地盤(pán)，再異步寫(xiě)到對(duì)象存儲(chǔ)。

# ./juicefs mount --writeback volume-demoz /jfs
# time xtrabackup --prepare --use-memory=4G --innodb-file-io-threads=16 --innodb-read-io-threads=16 --apply-log-only --target-dir=/jfs/base_snapshot

時(shí)間降到了 11.8 秒。

寫(xiě)過(guò)程已經(jīng)降到 1.5 秒左右。

我們看到讀線程讀操作依然比較密集，我們嘗試持續(xù)增加讀線程數(shù)，InnoDB 讀線程數(shù)最大為 64，我們直接調(diào)成 64。

# time xtrabackup --prepare --use-memory=4G --innodb-file-io-threads=64 --innodb-read-io-threads=64 --apply-log-only --target-dir=/jfs/base_snapshot

執(zhí)行時(shí)間 11.2 秒，相比之前基本沒(méi)變化。

我們看到，讀線程讀操作已經(jīng)比較稀疏了，應(yīng)該是線程讀的數(shù)據(jù)之間有依賴關(guān)系，導(dǎo)致不能完全并行化，已經(jīng)不能通過(guò)提升線程數(shù)壓縮讀過(guò)程的時(shí)間了。

增大 JuiceFS 的磁盤(pán)緩存

在上一步中，我們通過(guò)提升讀線程數(shù)來(lái)提升讀過(guò)程的效率已經(jīng)到頂了，只能通過(guò)降低讀數(shù)據(jù)的延遲來(lái)減少讀過(guò)程時(shí)間。

JuiceFS 在讀操作處理上提供了預(yù)讀和緩存加速能力，我們接下來(lái)嘗試通過(guò)增大 JuiceFS 的本地緩存來(lái)降低讀操作的延遲。

將 JuiceFS 的本地緩存由高效云盤(pán)換成 SSD 云盤(pán)，并將緩存大小由 1G 改成 10G。

# ./juicefs mount --writeback volume-demoz --cache-size=10000 --cache-dir=/data/jfsCache /jfs

# time xtrabackup --prepare --use-memory=4G --innodb-file-io-threads=64 --innodb-read-io-threads=64 --apply-log-only --target-dir=/jfs/base_snapshot

執(zhí)行時(shí)間降到了 6.9 秒。

通過(guò)提升緩存性能和增大緩存空間進(jìn)一步減少了讀操作耗時(shí)。

到此我們總結(jié)一下，我們通過(guò)分析 oplog，不斷尋找可以優(yōu)化的點(diǎn)，將整個(gè)數(shù)據(jù)準(zhǔn)備過(guò)程一步步從 62 秒降到 6.9 秒，效果通過(guò)下圖更直觀的展示。

增大數(shù)據(jù)庫(kù)數(shù)據(jù)量

以上的操作都是針對(duì) 11G 這樣一個(gè)比較小的數(shù)據(jù)集不斷調(diào)整參數(shù)進(jìn)行優(yōu)化得到一個(gè)很好的結(jié)果。作為對(duì)比，我們以同樣的方式生成一個(gè) 115G 左右的 partition 為10的單表數(shù)據(jù)庫(kù)。在 SysBench 持續(xù)每秒 50 個(gè)請(qǐng)求情況下，執(zhí)行備份操作。

# time xtrabackup --prepare --use-memory=4G --innodb-file-io-threads=64 --innodb-read-io-threads=64 --apply-log-only --target-dir=/jfs/base_snapshot

這個(gè)過(guò)程耗時(shí) 74 秒。

我們看到，讀和寫(xiě)還是分開(kāi)的。

在數(shù)據(jù)量增大10倍左右，相應(yīng)的準(zhǔn)備時(shí)間也增大到10倍。這是因?yàn)閭浞荩?code>xtrabackup --backup）過(guò)程所需的時(shí)間擴(kuò)大到 10 倍，在 SysBench 對(duì)數(shù)據(jù)庫(kù)壓力不變的情況下，備份過(guò)程中產(chǎn)生的 xtrabackup_logfile 也是原先的 10 倍。數(shù)據(jù)準(zhǔn)備是要把 xtrabackup_logfile 中的所有數(shù)據(jù)更新合并到數(shù)據(jù)文件中，可見(jiàn)即使數(shù)據(jù)規(guī)模增大了 10 倍，但更新單條日志的時(shí)間基本不變。從上圖也可以驗(yàn)證這一點(diǎn)，數(shù)據(jù)規(guī)模增大后，準(zhǔn)備過(guò)程仍然是分成了讀數(shù)據(jù)和寫(xiě)數(shù)據(jù)這兩個(gè)明顯的過(guò)程，說(shuō)明設(shè)定的 4GB 的緩沖區(qū)大小仍然是夠用的，整個(gè)過(guò)程仍然可以在內(nèi)存中完成然后更新到文件系統(tǒng)。

總結(jié)

我們使用 SysBench 這個(gè)相對(duì)簡(jiǎn)單的工具構(gòu)造初始數(shù)據(jù)，持續(xù)給數(shù)據(jù)庫(kù)一定數(shù)據(jù)更新的壓力模擬數(shù)據(jù)備份時(shí)數(shù)據(jù)庫(kù)運(yùn)行場(chǎng)景。使用 JuiceFS 的 oplog 來(lái)觀察 XtraBackup 在數(shù)據(jù)準(zhǔn)備過(guò)程中訪問(wèn)備份數(shù)據(jù)的讀寫(xiě)特點(diǎn)，調(diào)整 XtraBackup 和 JuiceFS 的參數(shù)來(lái)不斷優(yōu)化數(shù)據(jù)準(zhǔn)備過(guò)程的效率。

在實(shí)際生產(chǎn)場(chǎng)景中，情況比我們 SysBench 模擬要復(fù)雜得多，我們上面的線性關(guān)系不一定嚴(yán)格成立，但是我們通過(guò)分析 oplog 快速發(fā)現(xiàn)可以優(yōu)化的點(diǎn)，進(jìn)而不斷調(diào)整 XtraBackup 和 JuiceFS 的緩存和并發(fā)的思路是通用的。

整個(gè)調(diào)參過(guò)程耗時(shí) 1 小時(shí)左右，oplog 分析工具在這個(gè)過(guò)程中發(fā)揮了很大的作用，幫助我們快速定位系統(tǒng)性能瓶頸，從而針對(duì)性地調(diào)整參數(shù)做優(yōu)化，也希望這個(gè) oplog 分析功能也能幫助大家快速定位和分析遇到的性能問(wèn)題。

到此這篇關(guān)于利用JuiceFS使MySQL 備份驗(yàn)證性能提升 10 倍的文章就介紹到這了,更多相關(guān) MySQL 性能提升內(nèi)容請(qǐng)搜索腳本之家以前的文章或繼續(xù)瀏覽下面的相關(guān)文章希望大家以后多多支持腳本之家！

您可能感興趣的文章: