MySQL在線DDL工具 gh-ost的原理解析
一.簡(jiǎn)介
gh-ost基于 golang 語(yǔ)言,是 github 開(kāi)源的一個(gè) DDL 工具,是 GitHub's Online Schema Transmogrifier/Transfigurator/Transformer/Thingy 的縮寫(xiě),意思是 GitHub 的在線表定義轉(zhuǎn)換器。
1.1 原理
主要實(shí)現(xiàn)原理,首先建兩張表,一張_gho的影子表,gh-ost會(huì)將原表數(shù)據(jù)以及增量數(shù)據(jù)都應(yīng)用到這個(gè)表,最后會(huì)將這個(gè)表和原表做次表名切換,另一張是_ghc表,這個(gè)表是存放changelog的數(shù)據(jù),包括信號(hào)標(biāo)記,心跳等。其次,gh-ost會(huì)開(kāi)兩個(gè)goroutine,一個(gè)用于拷貝原表數(shù)據(jù),一個(gè)用于apply增量的binlog到_gho表,并且兩個(gè)goroutine的并行在跑的,也就是不用關(guān)心數(shù)據(jù)是先拷貝過(guò)去還是先apply binlog過(guò)去。因?yàn)檫@里會(huì)對(duì)insert語(yǔ)句做調(diào)整,首先我們拷貝的insert into會(huì)改寫(xiě)成insert ignore into,而binlog內(nèi)insert into會(huì)改寫(xiě)成replace into,這樣可以很好的支持兩個(gè)goroutine的并行。但這樣的調(diào)整能適用所有的DDL嗎?答案是否定的。最后,當(dāng)原表數(shù)據(jù)全部拷貝完成后,gh-ost會(huì)進(jìn)入到表交換階段,采用更加安全的原子交換。
1.2 過(guò)程
1. 檢查有沒(méi)有外鍵和觸發(fā)器。
2. 檢查表的主鍵信息。
3. 檢查是否主庫(kù)或從庫(kù),是否開(kāi)啟log_slave_updates,以及binlog信息
4. 檢查gho和del結(jié)尾的臨時(shí)表是否存在
5. 創(chuàng)建ghc結(jié)尾的表,存數(shù)據(jù)遷移的信息,以及binlog信息等
---以上校驗(yàn)階段
6. 初始化stream的連接,添加binlog的監(jiān)聽(tīng)
---以下遷移階段
7. 創(chuàng)建gho結(jié)尾的臨時(shí)表,執(zhí)行DDL在gho結(jié)尾的臨時(shí)表上
8. 開(kāi)啟事務(wù),按照主鍵id把源表數(shù)據(jù)寫(xiě)入到gho結(jié)尾的表上,再提交,以及binlog apply。
---以下cut-over階段
9. lock源表,rename 表:rename 源表 to 源_del表,gho表 to 源表。
10. 清理ghc表。
1.3 特性
1. 無(wú)觸發(fā)器:通過(guò)分析binlog日志的形式來(lái)監(jiān)聽(tīng)表中的數(shù)據(jù)變更。
2. 輕量級(jí):由于沒(méi)有使用觸發(fā)器,因此在操作的過(guò)程中對(duì)主庫(kù)的影響是最小的,也不用擔(dān)心并發(fā)和鎖。
3. 可暫停:所有的寫(xiě)操作都是由gh-ost控制的,當(dāng)限速的時(shí)候,gh-ost可以暫停向主庫(kù)寫(xiě)入數(shù)據(jù),創(chuàng)建一個(gè)內(nèi)部的tracking表,以最小的系統(tǒng)開(kāi)銷(xiāo)向這個(gè)表中寫(xiě)入心跳事件。
4. 動(dòng)態(tài)可控:gh-ost 可以通過(guò) unix socket 文件或者TCP端口(可配置)的方式來(lái)監(jiān)聽(tīng)請(qǐng)求,操作者可以在命令運(yùn)行后更改相應(yīng)的參數(shù)。
5. 可審計(jì):使用程序接口可以獲取 gh-ost 的狀態(tài),報(bào)告當(dāng)前的進(jìn)度,主要參數(shù)的配置以及當(dāng)前服務(wù)器 的標(biāo)示等等。
6. 可測(cè)試:gh-ost內(nèi)建支持測(cè)試功能,通過(guò)使用--test-on-replica參數(shù)來(lái)指定: 它可以在從庫(kù)上進(jìn)行變更操作,在操作結(jié)束時(shí)gh-ost將會(huì)停止復(fù)制,交換表,反向交換表,保留2個(gè)表并保持同步,停止復(fù)制??梢栽诳臻e時(shí)候測(cè)試和比較兩個(gè)表的數(shù)據(jù)情況。
1.4 github地址
https://github.com/github/gh-ost/
二.測(cè)試環(huán)境:
2.1 測(cè)試服務(wù)器
主庫(kù):110.119.120.231
從庫(kù):110.119.120.230
2.2 安裝
cd /usr/local/src/
wget https://github.com/github/gh-ost/releases/download/v1.0.48/gh-ost-binary-linux20190214020851.tar.gz
tar xzvf gh-ost-binary-linux-20190214020851.tar.gz -C /usr/local/
ln -s /usr/local/gh-ost /usr/bin/gh-ost
2.3 創(chuàng)建用戶(hù)
create user ghost@'110.%' identified by 'ghost';
grant ALL PRIVILEGES on *.* to ghost@'110.%';
flush privileges;
2.4 命令參數(shù)
Usage of gh-ost: --aliyun-rds:是否在阿里云數(shù)據(jù)庫(kù)上執(zhí)行。true --allow-master-master:是否允許gh-ost運(yùn)行在雙主復(fù)制架構(gòu)中,一般與-assume-master-host參數(shù)一起使用 --allow-nullable-unique-key:允許gh-ost在數(shù)據(jù)遷移依賴(lài)的唯一鍵可以為NULL,默認(rèn)為不允許為NULL的唯一鍵。如果數(shù)據(jù)遷移(migrate)依賴(lài)的唯一鍵允許NULL值,則可能造成數(shù)據(jù)不正確,請(qǐng)謹(jǐn)慎使用。 --allow-on-master:允許gh-ost直接運(yùn)行在主庫(kù)上。默認(rèn)gh-ost連接的從庫(kù)。此外,單實(shí)例上DDL,單個(gè)實(shí)例相當(dāng)于主庫(kù),需要開(kāi)啟--allow-on-master參數(shù)和ROW模式。 --alter string:DDL語(yǔ)句 --approve-renamed-columns ALTER:如果你修改一個(gè)列的名字,gh-ost將會(huì)識(shí)別到并且需要提供重命名列名的原因,默認(rèn)情況下gh-ost是不繼續(xù)執(zhí)行的,除非提供-approve-renamed-columns ALTER。 --ask-pass:MySQL密碼 --assume-master-host string:為gh-ost指定一個(gè)主庫(kù),格式為”ip:port”或者”hostname:port”。在這主主架構(gòu)里比較有用,或則在gh-ost發(fā)現(xiàn)不到主的時(shí)候有用。 --assume-rbr:確認(rèn)gh-ost連接的數(shù)據(jù)庫(kù)實(shí)例的binlog_format=ROW的情況下,可以指定-assume-rbr,這樣可以禁止從庫(kù)上運(yùn)行stop slave,start slave,執(zhí)行g(shù)h-ost用戶(hù)也不需要SUPER權(quán)限。 --check-flag --chunk-size int:在每次迭代中處理的行數(shù)量(允許范圍:100-100000),默認(rèn)值為1000。 --concurrent-rowcount:該參數(shù)如果為T(mén)rue(默認(rèn)值),則進(jìn)行row-copy之后,估算統(tǒng)計(jì)行數(shù)(使用explain select count(*)方式),并調(diào)整ETA時(shí)間,否則,gh-ost首先預(yù)估統(tǒng)計(jì)行數(shù),然后開(kāi)始row-copy。 --conf string:gh-ost的配置文件路徑。 --critical-load string:一系列逗號(hào)分隔的status-name=values組成,當(dāng)MySQL中status超過(guò)對(duì)應(yīng)的values,gh-ost將會(huì)退出。-critical-load Threads_connected=20,Connections=1500,指的是當(dāng)MySQL中的狀態(tài)值Threads_connected>20,Connections>1500的時(shí)候,gh-ost將會(huì)由于該數(shù)據(jù)庫(kù)嚴(yán)重負(fù)載而停止并退出。 Comma delimited status-name=threshold, same format as --max-load. When status exceeds threshold, app panics and quits --critical-load-hibernate-seconds int :負(fù)載達(dá)到critical-load時(shí),gh-ost在指定的時(shí)間內(nèi)進(jìn)入休眠狀態(tài)。 它不會(huì)讀/寫(xiě)任何來(lái)自任何服務(wù)器的任何內(nèi)容。 --critical-load-interval-millis int:當(dāng)值為0時(shí),當(dāng)達(dá)到-critical-load,gh-ost立即退出。當(dāng)值不為0時(shí),當(dāng)達(dá)到-critical-load,gh-ost會(huì)在-critical-load-interval-millis秒數(shù)后,再次進(jìn)行檢查,再次檢查依舊達(dá)到-critical-load,gh-ost將會(huì)退出。 --cut-over string:選擇cut-over類(lèi)型:atomic/two-step,atomic(默認(rèn))類(lèi)型的cut-over是github的算法,two-step采用的是facebook-OSC的算法。 --cut-over-exponential-backoff --cut-over-lock-timeout-seconds int:gh-ost在cut-over階段最大的鎖等待時(shí)間,當(dāng)鎖超時(shí)時(shí),gh-ost的cut-over將重試。(默認(rèn)值:3) --database string:數(shù)據(jù)庫(kù)名稱(chēng)。 --debug:debug模式。 --default-retries int:各種操作在panick前重試次數(shù)。(默認(rèn)為60) --discard-foreign-keys:該參數(shù)針對(duì)一個(gè)有外鍵的表,在gh-ost創(chuàng)建ghost表時(shí),并不會(huì)為ghost表創(chuàng)建外鍵。該參數(shù)很適合用于刪除外鍵,除此之外,請(qǐng)謹(jǐn)慎使用。 --dml-batch-size int:在單個(gè)事務(wù)中應(yīng)用DML事件的批量大小(范圍1-100)(默認(rèn)值為10) --exact-rowcount:準(zhǔn)確統(tǒng)計(jì)表行數(shù)(使用select count(*)的方式),得到更準(zhǔn)確的預(yù)估時(shí)間。 --execute:實(shí)際執(zhí)行alter&migrate表,默認(rèn)為noop,不執(zhí)行,僅僅做測(cè)試并退出,如果想要ALTER TABLE語(yǔ)句真正落實(shí)到數(shù)據(jù)庫(kù)中去,需要明確指定-execute --exponential-backoff-max-interval int --force-named-cut-over:如果為true,則'unpostpone | cut-over'交互式命令必須命名遷移的表 --force-table-names string:在臨時(shí)表上使用的表名前綴 --heartbeat-interval-millis int:gh-ost心跳頻率值,默認(rèn)為500 --help --hooks-hint string:任意消息通過(guò)GH_OST_HOOKS_HINT注入到鉤子 --hooks-path string:hook文件存放目錄(默認(rèn)為empty,即禁用hook)。hook會(huì)在這個(gè)目錄下尋找符合約定命名的hook文件來(lái)執(zhí)行。 --host string :MySQL IP/hostname --initially-drop-ghost-table:gh-ost操作之前,檢查并刪除已經(jīng)存在的ghost表。該參數(shù)不建議使用,請(qǐng)手動(dòng)處理原來(lái)存在的ghost表。默認(rèn)不啟用該參數(shù),gh-ost直接退出操作。 --initially-drop-old-table:gh-ost操作之前,檢查并刪除已經(jīng)存在的舊表。該參數(shù)不建議使用,請(qǐng)手動(dòng)處理原來(lái)存在的ghost表。默認(rèn)不啟用該參數(shù),gh-ost直接退出操作。 --initially-drop-socket-file:gh-ost強(qiáng)制刪除已經(jīng)存在的socket文件。該參數(shù)不建議使用,可能會(huì)刪除一個(gè)正在運(yùn)行的gh-ost程序,導(dǎo)致DDL失敗。 --master-password string :MySQL 主密碼 --master-user string:MysQL主賬號(hào) --max-lag-millis int:主從復(fù)制最大延遲時(shí)間,當(dāng)主從復(fù)制延遲時(shí)間超過(guò)該值后,gh-ost將采取節(jié)流(throttle)措施,默認(rèn)值:1500s。 --max-load string:逗號(hào)分隔狀態(tài)名稱(chēng)=閾值,如:'Threads_running=100,Threads_connected=500'. When status exceeds threshold, app throttles writes --migrate-on-replica:gh-ost的數(shù)據(jù)遷移(migrate)運(yùn)行在從庫(kù)上,而不是主庫(kù)上。 --nice-ratio float:每次chunk時(shí)間段的休眠時(shí)間,范圍[0.0…100.0]。0:每個(gè)chunk時(shí)間段不休眠,即一個(gè)chunk接著一個(gè)chunk執(zhí)行;1:每row-copy 1毫秒,則另外休眠1毫秒;0.7:每row-copy 10毫秒,則另外休眠7毫秒。 --ok-to-drop-table:gh-ost操作結(jié)束后,刪除舊表,默認(rèn)狀態(tài)是不刪除舊表,會(huì)存在_tablename_del表。 --panic-flag-file string:當(dāng)這個(gè)文件被創(chuàng)建,gh-ost將會(huì)立即退出。 --password string :MySQL密碼 --port int :MySQL端口,最好用從庫(kù) --postpone-cut-over-flag-file string:當(dāng)這個(gè)文件存在的時(shí)候,gh-ost的cut-over階段將會(huì)被推遲,數(shù)據(jù)仍然在復(fù)制,直到該文件被刪除。 --quiet:靜默模式。 --replica-server-id uint : gh-ost的server_id --replication-lag-query string:棄用 --serve-socket-file string:gh-ost的socket文件絕對(duì)路徑。 --serve-tcp-port int:gh-ost使用端口,默認(rèn)為關(guān)閉端口。 --skip-foreign-key-checks:確定你的表上沒(méi)有外鍵時(shí),設(shè)置為'true',并且希望跳過(guò)gh-ost驗(yàn)證的時(shí)間-skip-renamed-columns ALTER --skip-renamed-columns ALTER:如果你修改一個(gè)列的名字(如change column),gh-ost將會(huì)識(shí)別到并且需要提供重命名列名的原因,默認(rèn)情況下gh-ost是不繼續(xù)執(zhí)行的。該參數(shù)告訴gh-ost跳該列的數(shù)據(jù)遷移,讓gh-ost把重命名列作為無(wú)關(guān)緊要的列。該操作很危險(xiǎn),你會(huì)損失該列的所有值。 --stack:添加錯(cuò)誤堆棧追蹤。 --switch-to-rbr:讓gh-ost自動(dòng)將從庫(kù)的binlog_format轉(zhuǎn)換為ROW格式。 --table string:表名 --test-on-replica:在從庫(kù)上測(cè)試gh-ost,包括在從庫(kù)上數(shù)據(jù)遷移(migration),數(shù)據(jù)遷移完成后stop slave,原表和ghost表立刻交換而后立刻交換回來(lái)。繼續(xù)保持stop slave,使你可以對(duì)比兩張表。 --test-on-replica-skip-replica-stop:當(dāng)-test-on-replica執(zhí)行時(shí),該參數(shù)表示該過(guò)程中不用stop slave。 --throttle-additional-flag-file string:當(dāng)該文件被創(chuàng)建后,gh-ost操作立即停止。該參數(shù)可以用在多個(gè)gh-ost同時(shí)操作的時(shí)候,創(chuàng)建一個(gè)文件,讓所有的gh-ost操作停止,或者刪除這個(gè)文件,讓所有的gh-ost操作恢復(fù)。 --throttle-control-replicas string:列出所有需要被檢查主從復(fù)制延遲的從庫(kù)。 --throttle-flag-file string:當(dāng)該文件被創(chuàng)建后,gh-ost操作立即停止。該參數(shù)適合控制單個(gè)gh-ost操作。-throttle-additional-flag-file string適合控制多個(gè)gh-ost操作。 --throttle-http string --throttle-query string:節(jié)流查詢(xún)。每秒鐘執(zhí)行一次。當(dāng)返回值=0時(shí)不需要節(jié)流,當(dāng)返回值>0時(shí),需要執(zhí)行節(jié)流操作。該查詢(xún)會(huì)在數(shù)據(jù)遷移(migrated)服務(wù)器上操作,所以請(qǐng)確保該查詢(xún)是輕量級(jí)的。 --timestamp-old-table:在舊表名中使用時(shí)間戳。 這會(huì)使舊表名稱(chēng)具有唯一且無(wú)沖突的交叉遷移 --tungsten:告訴gh-ost你正在運(yùn)行的是一個(gè)tungsten-replication拓?fù)浣Y(jié)構(gòu)。 --user string :MYSQL用戶(hù) --verbose --version
三. 操作模式
模式一 連上從庫(kù),在主庫(kù)上修改
這是gh-ost 默認(rèn)的工作模式,它會(huì)查看從庫(kù)情況,找到集群的主庫(kù)并且連接上去。修改操作的具體步驟是:
1、在主庫(kù)上讀寫(xiě)行數(shù)據(jù);
2、在從庫(kù)上讀取二進(jìn)制日志事件,將變更應(yīng)用到主庫(kù)上;
3、在從庫(kù)上查看表格式、字段、主鍵、總行數(shù)等;
4、在從庫(kù)上讀取 gh-ost 內(nèi)部事件日志(比如心跳);
5、在主庫(kù)上完成表切換。
如果你的主庫(kù)的日志格式是 SBR,工具也可以正常工作。但從庫(kù)就必須配成啟用二進(jìn)制日志(log_bin, log_slave_updates)并且設(shè)置 binlog_format=ROW ( gh-ost 是讀取從庫(kù)的二進(jìn)制文件)。
使用示例:
# gh-ost --initially-drop-old-table --initially-drop-ghost-table --user="ghost" --password="ghost" --host=110.119.120.230 --port=3306 --database="test" --table="t1" --verbose --alter="ADD COLUMN y1 varchar(10),add column y2 int not null default 0 comment 'test' " --assume-rbr --execute
參數(shù)含義:
--initially-drop-old-table:gh-ost操作之前,檢查并刪除已經(jīng)存在的舊表。
--initially-drop-ghost-table:gh-ost操作之前,檢查并刪除已經(jīng)存在的ghost表。
--verbose:執(zhí)行過(guò)程輸出日志
--assume-rbr:確認(rèn)gh-ost連接的數(shù)據(jù)庫(kù)實(shí)例binlog_format=ROW的情況下,可以指定-assume-rbr,這樣可以避免從庫(kù)上運(yùn)行stop slave,start slave,執(zhí)行g(shù)h-ost的用戶(hù)也不需要SUPER權(quán)限。
模式二 直接在主庫(kù)上修改
如果沒(méi)有從庫(kù),或者不想在從庫(kù)上操作,那直接用主庫(kù)也是可以的。gh-ost 就會(huì)在主庫(kù)上直接做所有的操作。仍然可以在上面查看主從復(fù)制延遲。
1)主庫(kù)必須產(chǎn)生 Row 格式的二進(jìn)制日志
2)啟動(dòng) gh-ost 時(shí)必須用--allow-on-master 選項(xiàng)來(lái)開(kāi)啟這種模式
# gh-ost --initially-drop-old-table --initially-drop-ghost-table --user="ghost" --password="ghost" --host="110.119.120.231" --port=3306 --database="test" --table="t2" --verbose --alter="add column test_field varchar(256) default '';" --exact-rowcount --serve-socket-file=/tmp/gh-ost.t2.sock --panic-flag-file=/tmp/ghost.panic.t2.flag --postpone-cut-over-flag-file=/tmp/ghost.postpone.t2.flag --allow-on-master --execute
參數(shù)含義:
--exact-rowcount:準(zhǔn)確統(tǒng)計(jì)表行數(shù)(使用select count(*)的方式),得到更準(zhǔn)確的預(yù)估時(shí)間。
--serve-socket-file:gh-ost的socket文件絕對(duì)路徑。如:--serve-socket-file=/tmp/gh-ost.t1.sock 創(chuàng)建socket文件進(jìn)行監(jiān)聽(tīng),通過(guò)接口進(jìn)行參數(shù)調(diào)整,當(dāng)執(zhí)行操作的過(guò)程中發(fā)現(xiàn)負(fù)載、延遲上升了,不得 不終止操作,重新配置參數(shù),如 chunk-size,然后重新執(zhí)行操作命令,可以通過(guò)scoket接口進(jìn)行動(dòng)態(tài) 調(diào)整。
#暫停
echo throttle | socat - /tmp/gh-ost.t1.sock
#恢復(fù)
echo no-throttle | socat - /tmp/gh-ost.t1.sock
修改限速參數(shù):
echo chunk-size=1500 | socat - /tmp/gh-ost.t1.sock
echo max-lag-millis=2000 | socat - /tmp/gh-ost.t1.sock
echo max-load=Thread_running=30 | socat - /tmp/gh-ost.t1.sock
--panic-flag-file:這個(gè)文件被創(chuàng)建,會(huì)立即終止正在運(yùn)行的gh-ost,臨時(shí)文件清理需要手動(dòng)進(jìn)行。
--postpone-cut-over-flag-file:當(dāng)這個(gè)文件存在的時(shí)候,gh-ost的cut-over階段將會(huì)被推遲,數(shù)據(jù)仍 然在復(fù)制,但并不會(huì)切換表,直到該文件被刪除。
--allow-on-master:允許gh-ost直接運(yùn)行在主庫(kù)上。
模式三 在從庫(kù)上修改和測(cè)試
這種模式會(huì)在從庫(kù)上做修改,所有操作都是在從庫(kù)上做的,不會(huì)對(duì)主庫(kù)產(chǎn)生任何影響。在操作過(guò)程中, gh-ost 也會(huì)不時(shí)地暫停,以便從庫(kù)的數(shù)據(jù)可以保持最新。
--test-on-replica 表明操作只是為了測(cè)試目的。在進(jìn)行最終的切換操作之前,復(fù)制會(huì)被停止。原始表和臨時(shí)表會(huì)相互切換,再切換回來(lái),最終相當(dāng)于原始表沒(méi)被動(dòng)過(guò)。主從復(fù)制暫停的狀態(tài)下,可以檢查和對(duì)比這兩張表中的數(shù)據(jù)(若不想stop slave,可添加參數(shù)--test-on-replica-skip-replica-stop)。
# gh-ost --initially-drop-old-table --initially-drop-ghost-table --user="ghost" --password="ghost" --host=110.119.120.230 --port=3306 --database="test" --table="t3" --verbose --alter="ADD COLUMN abc1 varchar(10),add column abc2 int not null default 0 comment 'test' " --test-on-replica --assume-rbr --execute
rds限制:
1. 用戶(hù)沒(méi)有 Super 權(quán)限,因此使用過(guò)程中要加上--assume-rbr,gh-ost 會(huì)認(rèn)為 binlog 本身就是 row 模式,不會(huì)再去修改。阿里云RDS上的binlog 默認(rèn)也是 row 模式,所以不存在問(wèn)題。
2. 其它權(quán)限,主要是REPLICATION SLAVE,REPLICATION CLIENT可以拉取 binlog ,也可以獲得。
3、無(wú)法連接到備庫(kù)拉取binlog。備庫(kù)通常對(duì)用戶(hù)來(lái)說(shuō)是透明的,所以gh-ost需要直接連接到主庫(kù)上 去,這可能會(huì)增大對(duì)主庫(kù)的負(fù)載。使用的時(shí)候需要增加--allow-on-master,--assume-master-host。 官方推薦的方式也是連接到其中一個(gè)備庫(kù),因?yàn)闀?huì)有一些壓力較大的SELECT操作,放在備庫(kù)是最好的。
4、阿里云數(shù)據(jù)庫(kù)上執(zhí)行,需要增加一個(gè)參數(shù)--aliyun-rds。 目前用戶(hù)使用的話,記得加上以下幾個(gè)參數(shù): --allow-on-master --assume-rbr --assume-master-host --aliyun-rds
四.gh-ost與pt-osc對(duì)比
4.1 pt-osc的簡(jiǎn)單介紹
pt-osc之工作流程
1、檢查更改表是否有主鍵或唯一索引,是否有觸發(fā)器
2、檢查修改表的表結(jié)構(gòu),創(chuàng)建一個(gè)臨時(shí)表,在新表上執(zhí)行ALTER TABLE語(yǔ)句
3、在源表上創(chuàng)建三個(gè)觸發(fā)器分別對(duì)于INSERT UPDATE DELETE操作
4、從源表拷貝數(shù)據(jù)到臨時(shí)表,在拷貝過(guò)程中,對(duì)源表的更新操作會(huì)寫(xiě)入到新建表中
5、將臨時(shí)表和源表rename(需要元數(shù)據(jù)修改鎖,需要短時(shí)間鎖表)
6、刪除源表和觸發(fā)器,完成表結(jié)構(gòu)的修改。
pt-osc之工具限制
1、源表必須有主鍵或唯一索引,如果沒(méi)有工具將停止工作
2、如果線上的復(fù)制環(huán)境過(guò)濾器操作過(guò)于復(fù)雜,工具將無(wú)法工作
3、如果開(kāi)啟復(fù)制延遲檢查,但主從延遲時(shí),工具將暫停數(shù)據(jù)拷貝工作
4、如果開(kāi)啟主服務(wù)器負(fù)載檢查,但主服務(wù)器負(fù)載較高時(shí),工具將暫停操作
5、當(dāng)表使用外鍵時(shí),如果未使用--alter-foreign-keys-method參數(shù),工具將無(wú)法執(zhí)行
6、只支持Innodb存儲(chǔ)引擎表,且要求服務(wù)器上有該表1倍以上的空閑空間。
那么gh-ost對(duì)比pt-osc具體有哪些優(yōu)勢(shì)呢?下面先簡(jiǎn)單介紹下它的兩個(gè)最核心的特性。
4.2 Triggerless
在gh-ost出現(xiàn)之前第三方MySQL DDL工具均采用觸發(fā)器的方式進(jìn)行實(shí)現(xiàn),包括percona的pt-osc,F(xiàn)acebook的OSC等等。而gh-ost采用的機(jī)制和他們完全不同:它通過(guò)MySQL binlog來(lái)同步數(shù)據(jù),gh-ost本身注冊(cè)為一個(gè)fake slave,可以從集群中的master或者slave上拉取binlog,并實(shí)時(shí)解析,將變更表的所有DML操作都重新apply到影子表上面。因此對(duì)于發(fā)布期間變更表上發(fā)生的DML操作,可以完全避免由于觸發(fā)器而產(chǎn)生的性能開(kāi)銷(xiāo),以及鎖的爭(zhēng)搶。
除此之外,一般我們選擇目標(biāo)發(fā)布機(jī)器通常會(huì)選擇集群中slave節(jié)點(diǎn),而slave一般不會(huì)承載業(yè)務(wù),這樣binlog解析的開(kāi)銷(xiāo)也不會(huì)落在提供業(yè)務(wù)的master上面,而僅僅是一次異步的DML語(yǔ)句重放。
4.3 Dynamically controllable
另一個(gè)最重要的特性是動(dòng)態(tài)調(diào)控,這是此前其他第三方開(kāi)源工具所不具備的。
之前通過(guò)pt-osc發(fā)布時(shí),命令執(zhí)行后參數(shù)就沒(méi)法修改,除非停止重來(lái)。假設(shè)發(fā)布進(jìn)行到90%,突然由于其他各種原因?qū)е路?wù)器負(fù)載上升,為不影響業(yè)務(wù),只能選擇將發(fā)布停掉,等性能恢復(fù)再重來(lái)。
通過(guò)pt-osc發(fā)布的表都是很大的表,耗時(shí)較長(zhǎng),所以遇到這類(lèi)場(chǎng)景很尷尬。因此發(fā)布中參數(shù)如果可動(dòng)態(tài)調(diào)控將變得非常重要。gh-ost另外實(shí)現(xiàn)了一個(gè)socket server,我們可以在發(fā)布過(guò)程中,通過(guò)socket和發(fā)布進(jìn)程進(jìn)行實(shí)時(shí)交互,它可以支持實(shí)時(shí)的暫停,恢復(fù),以及很多參數(shù)的動(dòng)態(tài)調(diào)整,來(lái)適應(yīng)外界變化。
五.參考文獻(xiàn)
1.gh-ost原理
https://www.cnblogs.com/mysql-dba/p/9901589.html
2.技術(shù)分享 | gh-ost 在線 ddl 變更工具
https://zhuanlan.zhihu.com/p/83770402
3.干貨 | 攜程數(shù)據(jù)庫(kù)發(fā)布系統(tǒng)演進(jìn)之路
https://blog.csdn.net/ctrip_tech/article/details/108395676
4.MySQL在線DDL gh-ost 使用說(shuō)明
https://www.cnblogs.com/zhoujinyi/p/9187421.html
5.MySQL--pt-osc工具學(xué)習(xí)
https://www.cnblogs.com/TeyGao/p/7160421.html
到此這篇關(guān)于MySQL在線DDL工具 gh-ost的文章就介紹到這了,更多相關(guān)MySQL在線DDL gh-ost內(nèi)容請(qǐng)搜索腳本之家以前的文章或繼續(xù)瀏覽下面的相關(guān)文章希望大家以后多多支持腳本之家!
相關(guān)文章
Mysql數(shù)據(jù)庫(kù)中子查詢(xún)的使用
本文給大家分享mysql數(shù)據(jù)庫(kù)中子查詢(xún)的使用,非常不錯(cuò)具有參考借鑒價(jià)值,感興趣的朋友一起看看吧2016-10-10mysql中優(yōu)化和修復(fù)數(shù)據(jù)庫(kù)工具mysqlcheck詳細(xì)介紹
這篇文章主要介紹了mysql中優(yōu)化和修復(fù)數(shù)據(jù)庫(kù)工具mysqlcheck詳細(xì)介紹,需要的朋友可以參考下2014-05-05MySQL查詢(xún)表中重復(fù)數(shù)據(jù)的實(shí)現(xiàn)
在數(shù)據(jù)庫(kù)中,我們經(jīng)常需要查詢(xún)重復(fù)字段來(lái)確保數(shù)據(jù)的準(zhǔn)確性,如果數(shù)據(jù)中有重復(fù)字段,則可能會(huì)導(dǎo)致查詢(xún)結(jié)果錯(cuò)誤,本文就想詳細(xì)的介紹了MySQL查詢(xún)表中重復(fù)數(shù)據(jù),感興趣的可以了解一下2023-08-08mysql 操作總結(jié) INSERT和REPLACE
用于操作數(shù)據(jù)庫(kù)的SQL一般分為兩種,一種是查詢(xún)語(yǔ)句,也就是我們所說(shuō)的SELECT語(yǔ)句,另外一種就是更新語(yǔ)句,也叫做數(shù)據(jù)操作語(yǔ)句。2009-07-07mysql 某字段插入隨機(jī)數(shù)(插入隨機(jī)數(shù)到MySQL數(shù)據(jù)庫(kù))
這篇文章主要介紹了mysql 某字段插入隨機(jī)數(shù)(插入隨機(jī)數(shù)到MySQL數(shù)據(jù)庫(kù)),需要的朋友可以參考下2016-09-09MySQL?中MATCH?全文搜索關(guān)鍵字示例詳解
這篇文章主要介紹了MySQL?中MATCH?全文搜索關(guān)鍵字詳解,本文結(jié)合示例代碼給大家介紹的非常詳細(xì),對(duì)大家的學(xué)習(xí)或工作具有一定的參考借鑒價(jià)值,需要的朋友參考下吧2023-09-09詳解數(shù)據(jù)庫(kù)varchar與char有哪些區(qū)別
CHAR和VARCHAR是MySQL中兩種最重要的字符串類(lèi)型,兩者的原理和區(qū)別也是面試中高頻問(wèn)題,如果是你,會(huì)從哪幾個(gè)角度去回答這個(gè)問(wèn)題呢?今天,我給大家總結(jié)了一下相關(guān)知識(shí)點(diǎn),感興趣的朋友一起看看吧2023-10-10MySQL查詢(xún)隨機(jī)數(shù)據(jù)的4種方法和性能對(duì)比
從MySQL隨機(jī)選取數(shù)據(jù)也是我們最常用的一種發(fā)發(fā),其最簡(jiǎn)單的辦法就是使用”O(jiān)RDER BY RAND()”,本文介紹了包括ORDER BY RAND()的4種獲取隨機(jī)數(shù)據(jù)的方法,并分析了各自的優(yōu)缺點(diǎn)。2014-04-04解決mysql8.0.19 winx64版本的安裝問(wèn)題
這篇文章主要介紹了mysql8.0.19 數(shù)據(jù)庫(kù) winx64版本的安裝問(wèn)題及解決方法,本文給大家介紹的非常詳細(xì),對(duì)大家的學(xué)習(xí)或工作具有一定的參考借鑒價(jià)值,需要的朋友可以參考下2020-03-03