欧美bbbwbbbw肥妇,免费乱码人妻系列日韩,一级黄片

詳解監(jiān)聽MySQL的binlog日志工具分析:Canal

 更新時(shí)間:2020年10月20日 11:13:01   作者:大數(shù)據(jù)學(xué)習(xí)與分享  
Canal主要用途是基于MySQL數(shù)據(jù)庫增量日志解析,提供增量數(shù)據(jù)訂閱和消費(fèi),目前主要支持MySQL。接下來通過本文給大家介紹監(jiān)聽MySQL的binlog日志工具分析:Canal的相關(guān)知識(shí),感興趣的朋友一起看看吧

Canal是阿里巴巴旗下的一款開源項(xiàng)目,利用Java開發(fā)。主要用途是基于MySQL數(shù)據(jù)庫增量日志解析,提供增量數(shù)據(jù)訂閱和消費(fèi),目前主要支持MySQL。

GitHub地址:https://github.com/alibaba/canal

在介紹Canal內(nèi)部原理之前,首先來了解一下MySQL Master/Slave同步原理:

MySQL master啟動(dòng)binlog機(jī)制,將數(shù)據(jù)變更寫入二進(jìn)制日志(binary log, 其中記錄叫做二進(jìn)制日志事件binary log events,可以通過show binlog events進(jìn)行查看)MySQL slave(I/O thread)將master的binary log events拷貝到它的中繼日志(relay log)MySQL slave(SQL thread)重放relay log中事件,將數(shù)據(jù)變更反映它自己的數(shù)據(jù)中

Canal工作原理:

Canal模擬MySQL slave的交互協(xié)議,偽裝自己為MySQL slave,向MySQL master發(fā)送dump協(xié)議MySQL master收到dump請(qǐng)求,開始推送binary log給slave(也就是canal)Canal解析binary log對(duì)象(原始為byte流)

簡而言之,Canal是通過模擬成為MySQL的slave,監(jiān)聽MySQL的binlog日志來獲取數(shù)據(jù)。當(dāng)把MySQL的binlog設(shè)置為row模式以后,可以獲取到執(zhí)行的每一個(gè)Insert/Update/Delete的腳本,以及修改前和修改后的數(shù)據(jù),基于這個(gè)特性,Canal就能高效的獲取到MySQL數(shù)據(jù)的變更。 Canal架構(gòu):

說明: server代表一個(gè)Canal運(yùn)行實(shí)例,對(duì)應(yīng)于一個(gè)jvm instance對(duì)應(yīng)于一個(gè)數(shù)據(jù)隊(duì)列(1個(gè)server對(duì)應(yīng)1..n個(gè)instance)

EventParser:數(shù)據(jù)源接入,模擬slave協(xié)議和master進(jìn)行交互,協(xié)議解析

EventSink:Parser和Store連接器,主要進(jìn)行數(shù)據(jù)過濾,加工,分發(fā)的工作

EventStore:負(fù)責(zé)存儲(chǔ)

MemoryMetaManager:增量訂閱和消費(fèi)信息管理器

Event Parser設(shè)計(jì):

整個(gè)parser過程大致可分為以下幾步:

Connection獲取上一次解析成功的log position(如果是第一次啟動(dòng),則獲取初始指定的位置或者是當(dāng)前數(shù)據(jù)庫的binlog log position)Connection建立連接,向MySQL master發(fā)送BINLOG_DUMP請(qǐng)求MySQL開始推送binary Log接收到的binary Log通過BinlogParser進(jìn)行協(xié)議解析,補(bǔ)充一些特定信息。如補(bǔ)充字段名字、字段類型、主鍵信息、unsigned類型處理等將解析后的數(shù)據(jù)傳入到EventSink組件進(jìn)行數(shù)據(jù)存儲(chǔ)(這是一個(gè)阻塞操作,直到存儲(chǔ)成功)定時(shí)記錄binary Log位置,以便重啟后繼續(xù)進(jìn)行增量訂閱

如果需要同步的master宕機(jī),可以從它的其他slave節(jié)點(diǎn)繼續(xù)同步binlog日志,避免單點(diǎn)故障。 Event Sink設(shè)計(jì):

EventSink主要作用如下:

數(shù)據(jù)過濾:支持通配符的過濾模式,表名,字段內(nèi)容等

數(shù)據(jù)路由/分發(fā):解決1:n(1個(gè)parser對(duì)應(yīng)多個(gè)store的模式)

數(shù)據(jù)歸并:解決n:1(多個(gè)parser對(duì)應(yīng)1個(gè)store)

數(shù)據(jù)加工:在進(jìn)入store之前進(jìn)行額外的處理,比如join 數(shù)據(jù)1:n業(yè)務(wù)

為了合理的利用數(shù)據(jù)庫資源, 一般常見的業(yè)務(wù)都是按照schema進(jìn)行隔離,然后在MySQL上層或者dao這一層面上,進(jìn)行一個(gè)數(shù)據(jù)源路由,屏蔽數(shù)據(jù)庫物理位置對(duì)開發(fā)的影響,阿里系主要是通過cobar/tddl來解決數(shù)據(jù)源路由問題。所以,一般一個(gè)數(shù)據(jù)庫實(shí)例上,會(huì)部署多個(gè)schema,每個(gè)schema會(huì)有由1個(gè)或者多個(gè)業(yè)務(wù)方關(guān)注。

數(shù)據(jù)n:1業(yè)務(wù)

同樣,當(dāng)一個(gè)業(yè)務(wù)的數(shù)據(jù)規(guī)模達(dá)到一定的量級(jí)后,必然會(huì)涉及到水平拆分和垂直拆分的問題,針對(duì)這些拆分的數(shù)據(jù)需要處理時(shí),就需要鏈接多個(gè)store進(jìn)行處理,消費(fèi)的位點(diǎn)就會(huì)變成多份,而且數(shù)據(jù)消費(fèi)的進(jìn)度無法得到盡可能有序的保證。所以,在一定業(yè)務(wù)場(chǎng)景下,需要將拆分后的增量數(shù)據(jù)進(jìn)行歸并處理,比如按照時(shí)間戳/全局id進(jìn)行排序歸并。 Event Store設(shè)計(jì):

支持多種存儲(chǔ)模式,比如Memory內(nèi)存模式。采用內(nèi)存環(huán)裝的設(shè)計(jì)來保存消息,借鑒了Disruptor的RingBuffer的實(shí)現(xiàn)思路。 RingBuffer設(shè)計(jì):

定義了3個(gè)cursor:

put:Sink模塊進(jìn)行數(shù)據(jù)存儲(chǔ)的最后一次寫入位置(同步寫入數(shù)據(jù)的cursor)

get:數(shù)據(jù)訂閱獲取的最后一次提取位置(同步獲取的數(shù)據(jù)的cursor)

ack:數(shù)據(jù)消費(fèi)成功的最后一次消費(fèi)位置

借鑒Disruptor的RingBuffer的實(shí)現(xiàn),將RingBuffer拉直來看:

實(shí)現(xiàn)說明:

put/get/ack cursor用于遞增,采用long型存儲(chǔ)。三者之間的關(guān)系為put>=get>=ackbuffer的get操作,通過取余或者&操作。(&操作:cusor & (size - 1) , size需要為2的指數(shù),效率比較高)

Instance設(shè)計(jì):

instance代表了一個(gè)實(shí)際運(yùn)行的數(shù)據(jù)隊(duì)列,包括了EventPaser、EventSink、EventStore等組件。抽象了CanalInstanceGenerator,主要是考慮配置的管理方式:

manager方式:和你自己的內(nèi)部web console/manager系統(tǒng)進(jìn)行對(duì)接。(目前主要是公司內(nèi)部使用)

spring方式:基于spring xml + properties進(jìn)行定義,構(gòu)建spring配置。 Server設(shè)計(jì):

server代表了一個(gè)Canal運(yùn)行實(shí)例,為了方便組件化使用,特意抽象了Embeded(嵌入式)/Netty(網(wǎng)絡(luò)訪問)的兩種實(shí)現(xiàn)。

增量訂閱/消費(fèi)設(shè)計(jì):

具體的協(xié)議格式,可參見:CanalProtocol.proto。數(shù)據(jù)對(duì)象格式:EntryProtocol.proto

Entry
  Header
    logfileName [binlog文件名]
    logfileOffset [binlog position]
    executeTime [binlog里記錄變更發(fā)生的時(shí)間戳]
    schemaName [數(shù)據(jù)庫實(shí)例]
    tableName [表名]
    eventType [insert/update/delete類型]
  entryType  [事務(wù)頭BEGIN/事務(wù)尾END/數(shù)據(jù)ROWDATA]
  storeValue [byte數(shù)據(jù),可展開,對(duì)應(yīng)的類型為RowChange]

RowChange
isDdl    [是否是ddl變更操作,比如create table/drop table]
sql   [具體的ddl sql]
rowDatas  [具體insert/update/delete的變更數(shù)據(jù),可為多條,1個(gè)binlog event事件可對(duì)應(yīng)多條變更,比如批處理]
beforeColumns [Column類型的數(shù)組]
afterColumns [Column類型的數(shù)組]

Column
index    [column序號(hào)]
sqlType   [jdbc type]
name    [column name]
isKey    [是否為主鍵]
updated   [是否發(fā)生過變更]
isNull   [值是否為null]
value    [具體的內(nèi)容,注意為文本]

針對(duì)上述的補(bǔ)充說明:

1.可以提供數(shù)據(jù)庫變更前和變更后的字段內(nèi)容,針對(duì)binlog中沒有的name、isKey等信息進(jìn)行補(bǔ)全

2.可以提供ddl的變更語句

Canal HA機(jī)制:

Canal的HA實(shí)現(xiàn)機(jī)制是依賴zookeeper實(shí)現(xiàn)的,主要分為Canal server和Canal client的HA。 Canal server:為了減少對(duì)MySQL dump的請(qǐng)求,不同server上的instance要求同一時(shí)間只能有一個(gè)處于running狀態(tài),其他的處于standby狀態(tài)。

Canal client:為了保證有序性,一份instance同一時(shí)間只能由一個(gè)Canal client進(jìn)行g(shù)et/ack/rollback操作,否則客戶端接收無法保證有序。 Canal Server HA架構(gòu)圖:

大致步驟:

  • Canal server要啟動(dòng)某個(gè)Canal instance時(shí)都先向Zookeeper進(jìn)行一次嘗試啟動(dòng)判斷 (實(shí)現(xiàn):創(chuàng)建EPHEMERAL節(jié)點(diǎn),誰創(chuàng)建成功就允許誰啟動(dòng))
  • 創(chuàng)建Zookeeper節(jié)點(diǎn)成功后,對(duì)應(yīng)的Canal server就啟動(dòng)對(duì)應(yīng)的Canal instance,沒有創(chuàng)建成功的Canal instance就會(huì)處于standby狀態(tài)
  • 一旦Zookeeper發(fā)現(xiàn)Canal server A創(chuàng)建的節(jié)點(diǎn)消失后,立即通知其他的Canal server再次進(jìn)行步驟1的操作,重新選出一個(gè)Canal server啟動(dòng)instance
  • Canal client每次進(jìn)行connect時(shí),會(huì)首先向Zookeeper詢問當(dāng)前是誰啟動(dòng)了Canal instance,然后和其建立鏈接,一旦鏈接不可用,會(huì)重新嘗試connect

Canal Client的方式和Canal server方式類似,也是利用Zookeeper的搶占EPHEMERAL節(jié)點(diǎn)的方式進(jìn)行控制。

到此這篇關(guān)于詳解監(jiān)聽MySQL的binlog日志工具分析:Canal的文章就介紹到這了,更多相關(guān)MySQL的binlog日志內(nèi)容請(qǐng)搜索腳本之家以前的文章或繼續(xù)瀏覽下面的相關(guān)文章希望大家以后多多支持腳本之家!

相關(guān)文章

  • MySQL里面的子查詢實(shí)例

    MySQL里面的子查詢實(shí)例

    最近學(xué)習(xí)php+mysql執(zhí)行操作,發(fā)現(xiàn)了這一篇實(shí)例代碼
    2008-04-04
  • mysql表物理文件被誤刪的解決方法

    mysql表物理文件被誤刪的解決方法

    最近因?yàn)槭д`不小心誤刪了mysql表的物理文件,這個(gè)時(shí)候該怎么辦呢?然后抓緊從網(wǎng)上找解決的方法,終于解決了,現(xiàn)在將解決的方法及過程分享給大家,有需要的朋友們可以參考借鑒,感興趣的朋友們下面來一起學(xué)習(xí)學(xué)習(xí)吧。
    2016-11-11
  • MYSQL的binary解決mysql數(shù)據(jù)大小寫敏感問題的方法

    MYSQL的binary解決mysql數(shù)據(jù)大小寫敏感問題的方法

    BINARY不是函數(shù),是類型轉(zhuǎn)換運(yùn)算符,它用來強(qiáng)制它后面的字符串為一個(gè)二進(jìn)制字符串,可以理解為在字符串比較的時(shí)候區(qū)分大小寫
    2013-09-09
  • 逐步講解MySQL中定時(shí)事件計(jì)劃的創(chuàng)建

    逐步講解MySQL中定時(shí)事件計(jì)劃的創(chuàng)建

    這篇文章主要介紹了MySQL中定時(shí)事件計(jì)劃的創(chuàng)建,包括對(duì)于MySQL定時(shí)器的用戶事件權(quán)限作出了解釋說明,需要的朋友可以參考下
    2016-05-05
  • mysql索引篇explain命令詳解

    mysql索引篇explain命令詳解

    這篇文章主要介紹了mysql索引篇explain命令詳解,mysql中的explain命令可以用來查看sql語句是否使用了索引,用了什么索引,有沒有做全表掃描,更多相關(guān)內(nèi)容需要的小伙伴可以參考一下
    2022-08-08
  • mysql報(bào)錯(cuò):1406 Data too long for column問題的多種解決方案

    mysql報(bào)錯(cuò):1406 Data too long for colu

    這篇文章給大家介紹了多種解決mysql報(bào)錯(cuò):1406, Data too long for column的解決方法,如果有遇到相同問題的朋友可以參考閱讀本文,對(duì)解決問題有一定的幫助,需要的朋友可以參考下
    2023-09-09
  • mysql自動(dòng)停止 Plugin FEDERATED is disabled 的完美解決方法

    mysql自動(dòng)停止 Plugin FEDERATED is disabled 的完美解決方法

    今天在配置服務(wù)器的時(shí)候,發(fā)現(xiàn)mysql的一個(gè)錯(cuò)誤提示在 本地計(jì)算機(jī) 無法啟動(dòng) MySQL 服務(wù)。錯(cuò)誤 1067: 進(jìn)程意外終止,其實(shí)原因很多這個(gè)不是導(dǎo)致進(jìn)程意外終止的最終原因,但可以解決
    2016-04-04
  • mysql8.0.20配合binlog2sql的配置和簡單備份恢復(fù)的步驟詳解

    mysql8.0.20配合binlog2sql的配置和簡單備份恢復(fù)的步驟詳解

    這篇文章主要介紹了mysql8.0.20配合binlog2sql的配置和簡單備份恢復(fù)的步驟,本文給大家介紹的非常詳細(xì),對(duì)大家的學(xué)習(xí)或工作具有一定的參考借鑒價(jià)值,需要的朋友可以參考下
    2020-09-09
  • 如何修改mysql數(shù)據(jù)表主鍵

    如何修改mysql數(shù)據(jù)表主鍵

    這篇文章主要介紹了如何修改mysql數(shù)據(jù)表主鍵問題,具有很好的參考價(jià)值,希望對(duì)大家有所幫助。如有錯(cuò)誤或未考慮完全的地方,望不吝賜教
    2023-07-07
  • Mysql如何獲取json字符串/數(shù)組的值

    Mysql如何獲取json字符串/數(shù)組的值

    這篇文章主要介紹了Mysql如何獲取json字符串/數(shù)組的值問題,具有很好的參考價(jià)值,希望對(duì)大家有所幫助,如有錯(cuò)誤或未考慮完全的地方,望不吝賜教
    2024-08-08

最新評(píng)論