基于PostgreSQL/openGauss?的分布式數(shù)據(jù)庫解決方案
在 MySQL ShardingSphere-Proxy 逐漸成熟并被廣泛采用的同時(shí),ShardingSphere 團(tuán)隊(duì)也在 PostgreSQL ShardingSphere-Proxy 上持續(xù)發(fā)力。相比前期的 alpha 與 beta,5.0.0 正式版對 PostgreSQL 的協(xié)議實(shí)現(xiàn)、SQL 支持度、權(quán)限控制等方面進(jìn)行了大量的完善,為后續(xù)全面對接 PostgreSQL 生態(tài)打下基礎(chǔ)。ShardingSphere-Proxy 與 PostgreSQL 的生態(tài)對接,讓用戶能夠在 PostgreSQL 數(shù)據(jù)庫的基礎(chǔ)上獲得如數(shù)據(jù)分片、讀寫分離、影子庫、數(shù)據(jù)加密/脫敏、分布式治理等透明化的增量能力。
除了 PostgreSQL 方面,由華為開源的國產(chǎn)數(shù)據(jù)庫 openGauss 的熱度持續(xù)攀升。openGauss 具備優(yōu)秀的單機(jī)性能,配合 ShardingSphere 的能力和生態(tài),能夠打造出覆蓋更多場景的國產(chǎn)分布式數(shù)據(jù)庫解決方案。
ShardingSphere PostgreSQL/openGauss Proxy 目前能夠支持?jǐn)?shù)據(jù)分片、讀寫分離、影子庫、數(shù)據(jù)加密/脫敏、分布式治理等 Apache ShardingSphere 生態(tài)中大部分能力,在完善程度上逐漸對齊 ShardingSphere MySQL Proxy。
本文將給大家介紹 ShardingSphere-Proxy 5.0.0 在 PostgreSQL 上所做的提升以及與 openGauss 的生態(tài)對接。
作者介紹
吳偉杰
Apache ShardingSphere Committer,SphereEx 中間件工程師。目前專注于 Apache ShardingSphere 及其子項(xiàng)目 ElasticJob 的研發(fā)。
ShardingSphere-Proxy 介紹
ShardingSphere-Proxy 是 ShardingSphere 生態(tài)中的一個(gè)接入端,定位為對客戶端透明的數(shù)據(jù)庫代理。ShardingSphere Proxy 不局限于 Java,其實(shí)現(xiàn)了 MySQL、PostgreSQL 數(shù)據(jù)庫協(xié)議,可以使用各種兼容 MySQL / PostgreSQL 協(xié)議的客戶端連接并操作數(shù)據(jù)。
ShardingSphere-JDBC | ShardingSphere-Proxy | |
---|---|---|
數(shù)據(jù)庫 | 任意 | 基于 MySQL / PostgreSQL 協(xié)議的數(shù)據(jù)庫 |
連接消耗數(shù) | 高 | 低 |
異構(gòu)語言 | 支持 Java 等基于 JVM 語言 | 任意 |
性能 | 損耗低 | 損耗略高 |
無中心化 | 是 | 否 |
靜態(tài)入口 | 無 | 有 |
在做了分庫分表或其他規(guī)則的情況下,數(shù)據(jù)會(huì)分散到多個(gè)數(shù)據(jù)庫實(shí)例上,在管理上難免會(huì)有一些不便;或者使用非 Java 語言的開發(fā)者,需要 ShardingSphere 所提供的能力…… 以上這些情況,正是 ShardingSphere-Proxy 力所能及之處。
ShardingSphere-Proxy 隱藏了后端實(shí)際數(shù)據(jù)庫,對于客戶端來說就是在使用一個(gè)數(shù)據(jù)庫,不需要關(guān)心 ShardingSphere 如何協(xié)調(diào)背后的數(shù)據(jù)庫,對于使用非 Java 語言的開發(fā)者或 DBA 更友好。
在協(xié)議方面,ShardingSphere PostgreSQL Proxy 實(shí)現(xiàn)了 Simple Query 與大部分 Extended Query 協(xié)議,支持異構(gòu)語言通過 PostgreSQL/openGauss 驅(qū)動(dòng)連接 Proxy。ShardingSphere openGauss Proxy 在復(fù)用 PostgreSQL 協(xié)議的基礎(chǔ)上,還支持 openGauss 特有的批量插入?yún)f(xié)議。
不過,由于 ShardingSphere-Proxy 相比 ShardingSphere-JDBC 增加了一層網(wǎng)絡(luò)交互,SQL 執(zhí)行的延時(shí)會(huì)有所增加,損耗相比 ShardingSphere-JDBC 略高。
ShardingSphere-Proxy 與 PostgreSQL 的生態(tài)對接
兼容 PostgreSQL Simple Query 與 Extended Query
Simple Query 與 Extended Query 是大多數(shù)用戶在使用 PostgreSQL 時(shí)最常用的協(xié)議。
比如,使用如下命令行工具 psql
連接 PostgreSQL 數(shù)據(jù)庫進(jìn)行 CRUD 操作時(shí),主要使用 Simple Query 協(xié)議與數(shù)據(jù)庫交互。
$ psql -h 127.0.0.1 -U postgres psql (14.0 (Debian 14.0-1.pgdg110+1)) Type "help" for help. postgres=# select id, name from person where age < 35; id | name ----+------ 1 | Foo (1 row)
Simple Query 的協(xié)議交互示意圖如下:
當(dāng)用戶使用 PostgreSQL JDBC Driver 等驅(qū)動(dòng)時(shí),可能會(huì)如下代碼使用 PreparedStatement,默認(rèn)情況下對應(yīng)著 Extended Query 協(xié)議。
String sql = "select id, name from person where age > ?"; PreparedStatement ps = connection.prepareStatement(sql); ps.setInt(1, 35); ResultSet resultSet = ps.executeQuery();
Extended Query 的協(xié)議交互示意圖如下:
目前,ShardingSphere PostgreSQL Proxy 實(shí)現(xiàn)了 Simple Query 與大部分 Extended Query 協(xié)議,不過,因?yàn)閿?shù)據(jù)庫客戶端與驅(qū)動(dòng)已經(jīng)封裝好 API 供用戶使用,一般用戶并不需要關(guān)心數(shù)據(jù)庫協(xié)議層面的事情。
ShardingSphere-Proxy 兼容 PostgreSQL 的 Simple Query 與 Extended Query 意味著:用戶可以使用常見的 PostgreSQL 客戶端或驅(qū)動(dòng)連接 ShardingSphere-Proxy 進(jìn)行 CRUD 操作,利用 ShardingSphere 在數(shù)據(jù)庫上層提供的增量能力。
ShardingSphere-Proxy 與 openGauss 的生態(tài)對接
支持 openGauss JDBC Driver
openGauss 數(shù)據(jù)庫有對應(yīng)的 JDBC 驅(qū)動(dòng),JDBC URL 的前綴jdbc:opengauss
。雖然用 PostgreSQL 的 JDBC 驅(qū)動(dòng)也能夠連接 openGauss 數(shù)據(jù)庫,但這樣就無法完全利用 openGauss 特有的批量插入等特性。ShardingSphere 增加了 openGauss 數(shù)據(jù)庫類型,能夠識別 openGauss JDBC Driver,開發(fā)者在使用 ShardingSphere 的時(shí)候可以直接使用 openGauss 的 JDBC 驅(qū)動(dòng)。
支持 openGauss 批量插入?yún)f(xié)議
舉一個(gè)例子,當(dāng)我們 prepare 一個(gè) insert 語句如下
insert into person (id, name, age) values (?, ?, ?)
以 JDBC 為例,我們可能會(huì)使用如下方法執(zhí)行批量插入:
String sql = "insert into person (id, name, age) values (?, ?, ?)"; PreparedStatement ps = connection.prepareStatement(sql); ps.setLong(1, 1); ps.setString(2, "Foo"); ps.setInt(3, 18); ps.addBatch(); ps.setLong(1, 2); ps.setString(2, "Bar"); ps.setInt(3, 36); ps.addBatch(); ps.setLong(1, 3); ps.setString(2, "Tom"); ps.setInt(3, 54); ps.addBatch(); ps.executeBatch();
在 PostgreSQL 協(xié)議層面,Bind
消息每次能夠傳遞一組參數(shù)形成 Portal,Execute
每次能夠執(zhí)行一個(gè) Portal。執(zhí)行批量插入可以通過反復(fù)執(zhí)行 Bind
和 Execute
實(shí)現(xiàn)。協(xié)議交互示意圖如下:
Batch Bind
是 openGauss 特有的消息類型,相比原本的 Bind
,Batch Bind
一次能夠傳遞多組參數(shù),使用 Batch Bind
執(zhí)行批量插入的協(xié)議交互示意如下:
ShardingSphere-Proxy openGauss 實(shí)現(xiàn)了對 Batch Bind 協(xié)議的支持,也就是說,客戶端能夠直接用 openGauss 的客戶端或驅(qū)動(dòng)對 ShardingSphere Proxy 執(zhí)行批量插入。
ShardingSphere-Proxy 后續(xù)要做的事情
支持 ShardingSphere PostgreSQL Proxy 邏輯 MetaData 查詢
ShardingSphere-Proxy 作為透明數(shù)據(jù)庫代理,用戶無需關(guān)心 Proxy 如何協(xié)調(diào)背后的數(shù)據(jù)庫。
以下圖為例,在 ShardingSphere-Proxy 中配置邏輯庫 sharding_db
和邏輯表 person
,Proxy背后實(shí)際對應(yīng)了 2 個(gè)數(shù)據(jù)庫共 4 個(gè)表。
目前在 ShardingSphere MySQL Proxy 中分別執(zhí)行 show schemas
、show tables
語句,查詢的結(jié)果能夠正常的列出邏輯庫 sharding_db
和邏輯表 person
。
使用 psql
連接 PostgreSQL
時(shí)可以通過 \l
、\d
等命令查詢庫、表。但與 MySQL 不同的是,show tables
是 MySQL 所支持的語句,而在 psql
中所使用的 \d
實(shí)際上對應(yīng)了一條比較復(fù)雜的 SQL,目前使用 ShardingSphere PostgreSQL Proxy 暫時(shí)無法查詢出邏輯庫或邏輯表。
支持 Extended Query 的 Describe Prepared Statement
PostgreSQL 協(xié)議的 Describe 消息有兩種變體,分別是 Describe Portal 和 Describe Prepared Statement。目前 ShardingSphere Proxy 僅支持 Describe Portal,暫時(shí)不支持 Describe Prepared Statement。
Describe Prepared Statement 的實(shí)際應(yīng)用舉例:在 PreparedStatement 執(zhí)行之前獲取結(jié)果集的 MetaData。
PreparedStatement preparedStatement = connection.prepareStatement("select * from t_order limit ?"); ResultSetMetaData metaData = preparedStatement.getMetaData();
ShardingSphere 與 PostgreSQL/openGauss 生態(tài)對接的過程仍在進(jìn)行,后續(xù)需要做的事情還有很多。如果您對我們所做的事情感興趣,歡迎通過 GitHub 或郵件列表參與 ShardingSphere 社區(qū)。
GitHub: https://github.com/apache/shardingsphere
參考資料
https://www.postgresql.org/docs/current/protocol.html
到此這篇關(guān)于打造基于 PostgreSQL/openGauss 的分布式數(shù)據(jù)庫解決方案的文章就介紹到這了,更多相關(guān)PostgreSQL分布式數(shù)據(jù)庫內(nèi)容請搜索腳本之家以前的文章或繼續(xù)瀏覽下面的相關(guān)文章希望大家以后多多支持腳本之家!
相關(guān)文章
Postgresql源碼分析returns?setof函數(shù)oracle管道pipelined
這篇文章主要為大家介紹了Postgresql源碼分析returns?setof函數(shù)oracle管道pipelined,有需要的朋友可以借鑒參考下,希望能夠有所幫助,祝大家多多進(jìn)步,早日升職加薪2023-01-01在PostgreSQL中設(shè)置表中某列值自增或循環(huán)方式
這篇文章主要介紹了在PostgreSQL中設(shè)置表中某列值自增或循環(huán)方式,具有很好的參考價(jià)值,希望對大家有所幫助。一起跟隨小編過來看看吧2021-01-01postgresql insert into select無法使用并行查詢的解決
這篇文章主要介紹了postgresql insert into select無法使用并行查詢的解決,文中通過示例代碼介紹的非常詳細(xì),對大家的學(xué)習(xí)或者工作具有一定的參考學(xué)習(xí)價(jià)值,需要的朋友們下面隨著小編來一起學(xué)習(xí)學(xué)習(xí)吧2021-01-01基于PostgreSQL pg_hba.conf 配置參數(shù)的使用說明
這篇文章主要介紹了基于PostgreSQL pg_hba.conf 配置參數(shù)的使用說明,具有很好的參考價(jià)值,希望對大家有所幫助。一起跟隨小編過來看看吧2021-01-01PostgreSQL 性能優(yōu)化之服務(wù)器參數(shù)配置操作
這篇文章主要介紹了PostgreSQL 性能優(yōu)化之服務(wù)器參數(shù)配置操作,具有很好的參考價(jià)值,希望對大家有所幫助。一起跟隨小編過來看看吧2021-01-01PostgreSQL用戶、數(shù)據(jù)庫及表的管理、操作與授權(quán)方式
這篇文章主要介紹了PostgreSQL用戶、數(shù)據(jù)庫及表的管理、操作與授權(quán)操作,具有很好的參考價(jià)值,希望對大家有所幫助。一起跟隨小編過來看看吧2021-01-01