剖析后OpLog訂閱MongoDB的數(shù)據(jù)變更就沒(méi)那么難了
前言
我們開(kāi)源了一個(gè)訂閱分發(fā)mysql的binlog的項(xiàng)目,一直用的非常好,忽然有天開(kāi)發(fā)說(shuō)能不能支持MongoDB的數(shù)據(jù)訂閱呢,MongoDB的使用度也挺廣泛的。安排。經(jīng)過(guò)簡(jiǎn)單的了解后發(fā)現(xiàn)MongoDB也有類(lèi)似binlog的機(jī)制,最終花了兩天時(shí)間把功能完成,并統(tǒng)一抽象集成到binlog開(kāi)源項(xiàng)目中,使用和binlog同一套訂閱分發(fā)模型管理MongoDB數(shù)據(jù)源。整個(gè)過(guò)程非常順利,比整mysql的binlog要簡(jiǎn)單的多了。
oplog簡(jiǎn)介
先來(lái)聊聊MongoDB的主備機(jī)制,和mysql的binlog類(lèi)似,在MongoDB中,有一個(gè)系統(tǒng)庫(kù)“”Local”,庫(kù)里有一個(gè)集合“oplog.rs”,這個(gè)集合類(lèi)似于binlog文件,里面記錄了MongoDB的所有操作。從節(jié)點(diǎn)通過(guò)讀取oplog.rs里的數(shù)據(jù)做到數(shù)據(jù)同步。
解析oplog
和訂閱mysql的binlog一樣(模擬一個(gè)從節(jié)點(diǎn)mysql)。我們的訂閱服務(wù)要像從節(jié)點(diǎn)那樣讀取解析oplog.rs里的數(shù)據(jù)。解析前先看下oplog.rs的Document的數(shù)據(jù)結(jié)構(gòu)

上圖是一個(gè)插入的數(shù)據(jù)的日志,可見(jiàn)oplog的doc中共有如下字段,含義分別如下:
ts:操作的時(shí)間戳(非常重要)
t:term最初在主數(shù)據(jù)庫(kù)上生成操作的。(含義不明)
h:本次操作的唯一hashID
v: 版本號(hào)
op:操作類(lèi)型,有六種類(lèi)型,我們只需要關(guān)注其中的i(插入)、u(更新)、d(刪除)即可
ns:庫(kù)名和集合名稱(chēng),中間使用“.”連接
o:本次操作的document內(nèi)容
o2:只有op操作類(lèi)型時(shí)u更新時(shí),才會(huì)有這個(gè)字段,代表更新的條件語(yǔ)句
$set:o2獲取后的文檔里的屬性,代表更新的字段
如上字段,完成一次oplog的解析,只需要ts、op、ns、o、o2、$set即可,其中ts非常重要,可以類(lèi)比為binlog中的Position。同步mysql的數(shù)據(jù)時(shí),通過(guò)記錄消費(fèi)binlog的位置,也就是Position,可以有效避免訂閱服務(wù)停機(jī)后,消費(fèi)記錄丟失的問(wèn)題。同步MongoDB時(shí),通過(guò)記錄ts的值,來(lái)記錄消費(fèi)的位置,可以到達(dá)和訂閱binlog一樣的效果。和mysql訂閱不同的是,MongoDB的同步需要同步服務(wù)自己查詢,而且oplog在MongoDB4.0之前的版本有大小限制,超過(guò)設(shè)置的容量后,老的數(shù)據(jù)就會(huì)被丟失,在4.0之后的版本已經(jīng)解除了這個(gè)限制。
代碼
上面已經(jīng)分析了oplog的結(jié)構(gòu)以及訂閱步驟,下面我們直接構(gòu)建查詢即可,需要注意,每次獲取到的ts值,需要存儲(chǔ)記錄下來(lái),已便重新訂閱時(shí),從上次斷開(kāi)的記錄重新開(kāi)始。下面直接看代碼,重點(diǎn)邏輯都以注釋詳盡
private BsonTimestamp queryTs;
@Test
public void OpLogTest() {
MongoClient mongoClient = new MongoClient(new MongoClientURI("mongodb://admin:admin@127.0.0.1:3717"));
MongoCollectioncollection = mongoClient.getDatabase("local")
.getCollection("oplog.rs");
//如果是首次訂閱,需要使用自然排序查詢,獲取第最后一次操作的操作時(shí)間戳。如果是續(xù)訂閱直接讀取記錄的值賦值給queryTs即可
FindIterabletsCursor = collection.find().sort(new BasicDBObject("$natural", -1))
.limit(1);
Document tsDoc = tsCursor.first();
queryTs = (BsonTimestamp) tsDoc.get("ts");
while (true) try {
//構(gòu)建查詢語(yǔ)句,查詢大于當(dāng)前查詢時(shí)間戳queryTs的記錄
BasicDBObject query = new BasicDBObject("ts", new BasicDBObject("$gt", queryTs));
MongoCursordocCursor = collection.find(query)
.cursorType(CursorType.TailableAwait) //沒(méi)有數(shù)據(jù)時(shí)阻塞休眠
.noCursorTimeout(true) //防止服務(wù)器在不活動(dòng)時(shí)間(10分鐘)后使空閑的游標(biāo)超時(shí)。
.oplogReplay(true) //結(jié)合query條件,獲取增量數(shù)據(jù),這個(gè)參數(shù)比較難懂,見(jiàn):https://docs.mongodb.com/manual/reference/command/find/index.html
.maxAwaitTime(1, TimeUnit.SECONDS) //設(shè)置此操作在服務(wù)器上的最大等待執(zhí)行時(shí)間
.iterator();
while (docCursor.hasNext()) {
Document document = docCursor.next();
//更新查詢時(shí)間戳
queryTs = (BsonTimestamp) document.get("ts");
//TODO 在這里接收到數(shù)據(jù)后通過(guò)訂閱數(shù)據(jù)路由分發(fā)
String op = document.getString("op");
String database = document.getString("ns");
Document context = (Document) document.get("o");
Document where = null;
if (op.equals("u")) {
where = (Document) document.get("o2");
if (context != null) {
context = (Document) context.get("$set");
}
}
System.err.println("操作時(shí)間戳:" + queryTs.getTime());
System.err.println("操作類(lèi) 型:" + op);
System.err.println("數(shù)據(jù)庫(kù).集合:" + database);
System.err.println("更新條件:" + JSON.toJSONString(where));
System.err.println("文檔內(nèi)容:" + JSON.toJSONString(context));
}
} catch (Exception e) { e.printStackTrace(); }
}結(jié)語(yǔ)
上面代碼只是一個(gè)簡(jiǎn)單的測(cè)試用例,完整的應(yīng)用還需要考慮ts的記錄更新,事件的抽象,數(shù)據(jù)的分發(fā)等。我們已經(jīng)開(kāi)源的binlog訂閱分發(fā)項(xiàng)目目前支持?jǐn)?shù)據(jù)源在線管理,訂閱數(shù)據(jù)(庫(kù)、表)在線管理,如果能夠使用同一套管理后臺(tái)管理binlog和oplog的訂閱在好不過(guò)。要實(shí)現(xiàn)和binlog統(tǒng)一管理模型,配置和分發(fā)方面基本不需要改動(dòng),然后從頂層數(shù)據(jù)源方面做區(qū)分實(shí)現(xiàn)即可。
目前我們整合管理的功能都已經(jīng)開(kāi)發(fā)好了,關(guān)于oplog部分的代碼還沒(méi)提交到github上,后面會(huì)和大家相見(jiàn)。
以上就是剖析后OpLog訂閱MongoDB的數(shù)據(jù)變更就沒(méi)那么難了的詳細(xì)內(nèi)容,更多關(guān)于OpLog訂閱MongoDB的數(shù)據(jù)變更的資料請(qǐng)關(guān)注腳本之家其它相關(guān)文章!
相關(guān)文章
Mongodb設(shè)置TTL索引自動(dòng)清除數(shù)據(jù)與過(guò)期數(shù)據(jù)的方法
今天小編就為大家分享一篇關(guān)于Mongodb設(shè)置TTL索引自動(dòng)清除數(shù)據(jù)與過(guò)期數(shù)據(jù)的方法,小編覺(jué)得內(nèi)容挺不錯(cuò)的,現(xiàn)在分享給大家,具有很好的參考價(jià)值,需要的朋友一起跟隨小編來(lái)看看吧2019-03-03
解決MongoDB占用內(nèi)存過(guò)大頻繁死機(jī)的方法詳解
這篇文章主要介紹了解決MongoDB占用內(nèi)存過(guò)大頻繁死機(jī)的方法詳解,需要的朋友可以參考下2020-02-02
深入了解MongoDB是如何存儲(chǔ)數(shù)據(jù)的
MongoDB是一個(gè)可擴(kuò)展、高性能的分布式文檔存儲(chǔ)數(shù)據(jù)庫(kù),由C 語(yǔ)言編寫(xiě),下面這篇文章主要給大家介紹了關(guān)于MongoDB是如何存儲(chǔ)數(shù)據(jù)的相關(guān)資料,文中介紹的非常詳細(xì),對(duì)大家具有一定的參考學(xué)習(xí)價(jià)值,需要的朋友們下面來(lái)一起看看吧。2017-07-07
MongoDB下根據(jù)數(shù)組大小進(jìn)行查詢的方法
這篇文章主要介紹了MongoDB下根據(jù)數(shù)組大小進(jìn)行查詢的方法,分別實(shí)現(xiàn)了指定大小的數(shù)組和某個(gè)范圍的數(shù)組,需要的朋友可以參考下2014-04-04
MongoDB進(jìn)階之動(dòng)態(tài)字段設(shè)計(jì)詳解
這篇文章主要給大家介紹了MongoDB進(jìn)階之動(dòng)態(tài)字段設(shè)計(jì)的相關(guān)資料,文中介紹的非常詳細(xì),對(duì)大家具有一定的參考學(xué)習(xí)價(jià)值,需要的朋友們下面跟著小編一起來(lái)學(xué)習(xí)學(xué)習(xí)吧。2017-06-06
Mongodb中MapReduce實(shí)現(xiàn)數(shù)據(jù)聚合方法詳解
Mongodb是針對(duì)大數(shù)據(jù)量環(huán)境下誕生的用于保存大數(shù)據(jù)量的非關(guān)系型數(shù)據(jù)庫(kù),針對(duì)大量的數(shù)據(jù)。接下來(lái)通過(guò)本文給大家介紹Mongodb中MapReduce實(shí)現(xiàn)數(shù)據(jù)聚合方法詳解,感興趣的朋友一起學(xué)習(xí)吧2016-05-05
把MongoDB作為循環(huán)隊(duì)列的方法詳解
這篇文章主要給大家介紹了關(guān)于把MongoDB作為循環(huán)隊(duì)列的相關(guān)資料,文中通過(guò)示例代碼介紹的非常詳細(xì),對(duì)大家的學(xué)習(xí)或者工作具有一定的參考學(xué)習(xí)價(jià)值,需要的朋友們下面隨著小編來(lái)一起學(xué)習(xí)學(xué)習(xí)吧2021-03-03
MongoDB的基礎(chǔ)知識(shí)簡(jiǎn)介
這篇文章主要介紹了MongoDB的基礎(chǔ)知識(shí)簡(jiǎn)介,需要的朋友可以參考下2017-05-05
MongoDB使用自帶的命令行工具進(jìn)行備份和恢復(fù)的教程
這篇文章主要介紹了MongoDB使用自帶的命令行工具進(jìn)行備份和恢復(fù)的教程,我們只需要在命令行界面中用簡(jiǎn)單的命令操作mongorestore和mongodump工具就可以實(shí)現(xiàn),需要的朋友可以參考下2016-06-06

