快捷導(dǎo)航

PostgreSQL邏輯復(fù)制解密原理解析

更新時(shí)間：2022年09月21日 11:20:19 作者：京東云開(kāi)發(fā)者

邏輯復(fù)制，是基于復(fù)制標(biāo)識(shí)復(fù)制數(shù)據(jù)及其變化的一種方法，區(qū)別于物理復(fù)制對(duì)頁(yè)面操作的描述，邏輯復(fù)制是對(duì)事務(wù)及數(shù)據(jù)元組的一種描述，這篇文章主要介紹了PostgreSQL邏輯復(fù)制解密原理解析,需要的朋友可以參考下

在數(shù)字化時(shí)代的今天，我們都認(rèn)同數(shù)據(jù)會(huì)創(chuàng)造價(jià)值。為了最大化數(shù)據(jù)的價(jià)值，我們不停的建立著數(shù)據(jù)遷移的管道，從同構(gòu)到異構(gòu)，從關(guān)系型到非關(guān)系型，從云下到云上，從數(shù)倉(cāng)到數(shù)據(jù)湖，試圖在各種場(chǎng)景挖掘數(shù)據(jù)的價(jià)值。而在這縱橫交錯(cuò)的數(shù)據(jù)網(wǎng)絡(luò)中，邏輯復(fù)制扮演著及其重要的角色。讓我們將視角從復(fù)雜的網(wǎng)絡(luò)拉回其中的一個(gè)端點(diǎn)，從PostgreSQL出發(fā)，對(duì)其邏輯復(fù)制的原理進(jìn)行解密。

在數(shù)字化時(shí)代的今天，我們都認(rèn)同數(shù)據(jù)會(huì)創(chuàng)造價(jià)值。為了最大化數(shù)據(jù)的價(jià)值，我們不停的建立著數(shù)據(jù)遷移的管道，從同構(gòu)到異構(gòu)，從關(guān)系型到非關(guān)系型，從云下到云上，從數(shù)倉(cāng)到數(shù)據(jù)湖，試圖在各種場(chǎng)景挖掘數(shù)據(jù)的價(jià)值。而在這縱橫交錯(cuò)的數(shù)據(jù)網(wǎng)絡(luò)中，邏輯復(fù)制扮演著及其重要的角色。

讓我們將視角從復(fù)雜的網(wǎng)絡(luò)拉回其中的一個(gè)端點(diǎn)，從PostgreSQL出發(fā)，對(duì)其邏輯復(fù)制的原理進(jìn)行解密。

1 概念與原理

邏輯復(fù)制，是基于復(fù)制標(biāo)識(shí)復(fù)制數(shù)據(jù)及其變化的一種方法。區(qū)別于物理復(fù)制對(duì)頁(yè)面操作的描述，邏輯復(fù)制是對(duì)事務(wù)及數(shù)據(jù)元組的一種描述。

圖-WAL數(shù)據(jù)流示例

如圖所示，物理復(fù)制的數(shù)據(jù)流是對(duì)tablespace/database/filenode文件的塊進(jìn)行操作，而邏輯復(fù)制的內(nèi)容是對(duì)元組進(jìn)行描述。

接下來(lái)我們來(lái)看邏輯復(fù)制中的幾個(gè)概念：

復(fù)制槽

復(fù)制槽是記錄復(fù)制狀態(tài)的一組信息。由于WAL（預(yù)寫(xiě)式日志）文件在數(shù)據(jù)真正落盤(pán)后會(huì)刪除，復(fù)制槽會(huì)防止過(guò)早清理邏輯復(fù)制解析所需的WAL日志。在邏輯復(fù)制中，每個(gè)插槽從單個(gè)數(shù)據(jù)庫(kù)流式傳輸一系列更改，創(chuàng)建復(fù)制槽需要指定其使用的輸出插件，同時(shí)創(chuàng)建復(fù)制槽時(shí)會(huì)提供一個(gè)快照。

輸出插件

輸出插件負(fù)責(zé)將WAL日志解碼為可讀的格式，常用的插件用test_decoding(多用來(lái)測(cè)試)，pgoutput（默認(rèn)使用），wal2json（輸出為json）。PostgreSQL定義了一系列回調(diào)函數(shù)，我們除了使用上述插件，可以通過(guò)回調(diào)函數(shù)編寫(xiě)自己的輸出插件。

圖-復(fù)制槽數(shù)據(jù)流

復(fù)制協(xié)議與消息

通過(guò)復(fù)制協(xié)議，我們可以從源端獲取WAL數(shù)據(jù)流。例如通過(guò)PSQL工具建議復(fù)制連接

psql "dbname=postgres replication=database"

開(kāi)啟流式傳輸WAL

START_REPLICATION[ SLOT slot_name] [ PHYSICAL] XXX/XXX[ TIMELINE tli]

無(wú)論是物理復(fù)制，還是邏輯復(fù)制，使用PostgreSQL的發(fā)布訂閱或者pg_basebackup搭建流復(fù)制，都是通過(guò)復(fù)制協(xié)議與定義的消息進(jìn)行交互（物理復(fù)制和邏輯復(fù)制數(shù)據(jù)流內(nèi)容不同）

圖- WAL數(shù)據(jù)流消息類(lèi)型

圖-邏輯復(fù)制中的XLogData消息

工作流程

當(dāng)我們了解了概念之后，來(lái)看一下整個(gè)解析的工作流程。由于WAL文件里一個(gè)事務(wù)的內(nèi)容并不一定是連續(xù)的，所以需要通過(guò)Reorder后放在buffer中，根據(jù)事務(wù)ID組織成一條消息，COMMIT后發(fā)送給輸出插件，輸出插件解析后將消息流發(fā)送給目標(biāo)端。

圖-邏輯解析工作流程

2 問(wèn)題與演進(jìn)

當(dāng)我們掌握了邏輯復(fù)制的原理，計(jì)劃使用其構(gòu)建我們的數(shù)據(jù)遷移應(yīng)用之前，我們還有一些問(wèn)題并沒(méi)有解決。讓我們來(lái)一起看看是什么亟待解決的問(wèn)題，以及我們?nèi)绾芜M(jìn)行處理。

問(wèn)題一：Failover slot

為了高可用性，數(shù)據(jù)庫(kù)至少會(huì)存在一主一備的架構(gòu)，當(dāng)主庫(kù)故障進(jìn)行高可用切換時(shí)，備庫(kù)卻沒(méi)有相應(yīng)的復(fù)制槽信息，也就是缺少failover slot。這是由于保存slot信息的物理文件，未同步至備庫(kù)。那么我們?nèi)绾问謩?dòng)創(chuàng)建一個(gè)faliover slot呢？

1. 主庫(kù)創(chuàng)建復(fù)制槽，檢查備庫(kù)wal文件是否連續(xù)

2. 復(fù)制包含slot信息的物理文件至備庫(kù)，在pg_repslot目錄下

3. 備庫(kù)重啟，重啟后才可以看到復(fù)制槽信息，原因是讀取slot物理文件的函數(shù)StartupReplicationSlots只會(huì)在postmaster進(jìn)程啟動(dòng)時(shí)調(diào)用。

4. 定期查詢(xún)主庫(kù)slot狀態(tài)，使用pg_replication_slot_advance函數(shù)推進(jìn)備庫(kù)復(fù)制槽

自此，我們?cè)趥鋷?kù)上也有了相應(yīng)的信息，手動(dòng)實(shí)現(xiàn)了failover slot。PostgreSQL生態(tài)中著名的高可用軟件Patroni也是以這種方式進(jìn)行了實(shí)現(xiàn)，區(qū)別只是在Patroni查詢(xún)主庫(kù)slot狀態(tài)時(shí)將信息寫(xiě)入了DCS中，備庫(kù)拿到DCS中的位點(diǎn)信息進(jìn)行推進(jìn)。

問(wèn)題二：DDL同步

原生的邏輯復(fù)制不支持解析DDL語(yǔ)句，我們可以使用事件觸發(fā)器來(lái)進(jìn)行處理。

1. 使用事件觸發(fā)器感知表結(jié)構(gòu)變更，記錄到DDL_RECORD表中，并將該表通過(guò)邏輯復(fù)制進(jìn)行發(fā)布。

2. 接收端獲取到該表的數(shù)據(jù)變更，即可處理為相應(yīng)DDL語(yǔ)句進(jìn)行執(zhí)行。

圖-事件觸發(fā)器實(shí)現(xiàn)DDL同步

問(wèn)題三：雙向同步

當(dāng)數(shù)據(jù)遷移涉及雙向同步的管道時(shí)，例如想實(shí)現(xiàn)雙主雙寫(xiě)，對(duì)數(shù)據(jù)庫(kù)同一對(duì)象進(jìn)行操作，就會(huì)出現(xiàn)WAL循環(huán)。

圖-相同表雙向同步導(dǎo)致數(shù)據(jù)循環(huán)

部分DTS應(yīng)用為了解決這個(gè)問(wèn)題會(huì)創(chuàng)建輔助表，在事務(wù)中先對(duì)輔助表進(jìn)行操作，通過(guò)解析到對(duì)輔助表的操作而得知該記錄是又DTS應(yīng)用插入，從而過(guò)濾該事務(wù)，不再循環(huán)解析。PostgreSQL對(duì)事務(wù)提供了Origin記錄，無(wú)須輔助表，通過(guò)pg_replication_origin_session_setup函數(shù)或者發(fā)布訂閱中的replorigin_create即可指定Origin ID。

指定Origin ID后，我們除了可以解析后通過(guò)DTS應(yīng)用進(jìn)行過(guò)濾，還也可以通過(guò)解析插件中的FilterByOriginCB回調(diào)函數(shù)在解析過(guò)程中過(guò)濾，這種方式減少了數(shù)據(jù)傳輸，效率更高。

圖-test_decoding中OriginFilter函數(shù)DEMO

其他問(wèn)題：

除了以上三個(gè)問(wèn)題，還有一些使用的問(wèn)題或限制。這里列出了一些，不再展開(kāi)，僅簡(jiǎn)要說(shuō)明。

Toast處理：對(duì)于toast值(消息格式中可以判斷)，我們?cè)谔幚頃r(shí)一般使用占位符進(jìn)行處理，接收端接收到占位符就不對(duì)這一列進(jìn)行處理，雖然有些麻煩，但這也是在和傳輸toast值的方案中權(quán)衡的結(jié)果。

心跳表：由于復(fù)制槽記錄的XMIN是全局的，當(dāng)我們發(fā)布的表一直沒(méi)有更新時(shí)，XMIN沒(méi)有推進(jìn)導(dǎo)致WAL積壓，我們可以創(chuàng)建一張心跳表，周期性寫(xiě)入數(shù)據(jù)并發(fā)布，使XMIN進(jìn)行推進(jìn)。

大事務(wù)延遲：根據(jù)前文提到的工作流程我們可以知道默認(rèn)事務(wù)在COMMIT后才會(huì)進(jìn)行解析，這對(duì)于大事務(wù)來(lái)說(shuō)勢(shì)必會(huì)導(dǎo)致延遲，PG14版本提供了streamin模式進(jìn)行解析，即事務(wù)進(jìn)行中進(jìn)行解析并發(fā)送至接收端。

3 應(yīng)用與實(shí)踐

前兩節(jié)我們從原理及問(wèn)題的角度對(duì)PostgreSQL進(jìn)行了解密，接下來(lái)我們看如何通過(guò)我們掌握的邏輯復(fù)制原理，進(jìn)行數(shù)據(jù)遷移的應(yīng)用與實(shí)踐。

全量與增量同步

在真實(shí)的數(shù)據(jù)遷移場(chǎng)景中，大部分都是全量和增量都要同步的場(chǎng)景，并且我們打通了數(shù)據(jù)傳輸?shù)耐ǖ篮?，也?duì)這條通道的安全，效率，以及功能的擴(kuò)展，例如清洗，脫敏等ETL能力提出了新的要求。我們先來(lái)看一下如果實(shí)現(xiàn)全量與增量的同步。

圖-數(shù)據(jù)流向示意圖

主要流程包括：

1. 創(chuàng)建復(fù)制槽并導(dǎo)出快照

2. 根據(jù)快照進(jìn)行全量數(shù)據(jù)遷移

3. 根據(jù)復(fù)制槽進(jìn)行增量數(shù)據(jù)的遷移

我們使用了PG數(shù)據(jù)庫(kù)或者消息隊(duì)列MQ作為數(shù)據(jù)代理，全量與增量解析可以同時(shí)進(jìn)行，當(dāng)全量數(shù)據(jù)處理完畢后，狀態(tài)機(jī)通知增量處理程序進(jìn)行增量發(fā)布。而對(duì)于代理中的數(shù)據(jù)，可以在解析后進(jìn)行預(yù)處理。

自建實(shí)例遷移上云實(shí)踐

最后和大家分享一個(gè)自建實(shí)例遷移上云的實(shí)踐，該案例是將自建的PG10版本實(shí)例遷移至京東云上的RDS PG 11版本，通過(guò)對(duì)增量數(shù)據(jù)的回流以及數(shù)據(jù)校驗(yàn)保證了數(shù)據(jù)安全與業(yè)務(wù)平穩(wěn)切換。

圖-數(shù)據(jù)遷移上云

DTS應(yīng)用主要分為如下幾個(gè)階段：

1. 數(shù)據(jù)檢查階段：檢查主鍵，權(quán)限，配置

2. 數(shù)據(jù)遷移階段：結(jié)構(gòu)，存量，增量數(shù)據(jù)遷移，監(jiān)控遷移狀態(tài)

3. 應(yīng)用遷移階段：切換域名，引入流量

4. 回滾階段：增量數(shù)據(jù)回流，若出現(xiàn)問(wèn)題可快速回滾。

到此這篇關(guān)于PostgreSQL邏輯復(fù)制解密原理解析的文章就介紹到這了,更多相關(guān)PostgreSQL邏輯復(fù)制解密內(nèi)容請(qǐng)搜索腳本之家以前的文章或繼續(xù)瀏覽下面的相關(guān)文章希望大家以后多多支持腳本之家！

您可能感興趣的文章:

欧美bbbwbbbw肥妇,免费乱码人妻系列日韩,一级黄片

PostgreSQL邏輯復(fù)制解密原理解析

目錄