PostgreSQL分區(qū)表(partitioning)應用實例詳解
前言
項目中有需求要垂直分表,即按照時間區(qū)間將數據拆分到n個表中,PostgreSQL提供了分區(qū)表的功能。分區(qū)表實際上是把邏輯上的一個大表分割成物理上的幾小塊,提供了很多好處,比如:
1、查詢性能大幅提升
2、刪除歷史數據更快
3、可將不常用的歷史數據使用表空間技術轉移到低成本的存儲介質上
那么什么時候該使用分區(qū)表呢?官方給出的指導意見是:當表的大小超過了數據庫服務器的物理內存大小則應當使用分區(qū)表,接下來結合一個例子具體記錄一下創(chuàng)建分區(qū)表的詳細過程。
創(chuàng)建分區(qū)表
首先看一下需求,現(xiàn)在有一張日志表,現(xiàn)在需要按表中的操作時間字段(operation_time)分區(qū),如下圖:
這個需求就是一個典型的按時間創(chuàng)建分區(qū)表,首先看一下步驟:
1.創(chuàng)建父表
2.創(chuàng)建n個子表,每個子表都是繼承于父表
3.定義一個規(guī)則(Rule)或觸發(fā)器(Trigger),把對主表的數據插入重定向到合適的分區(qū)表
如上所示,整體的大步驟就分為以上三個,當然還可以有一些小的優(yōu)化措施,比如對于每個分區(qū),在關鍵字字段上創(chuàng)建一個索引等等。首先來看第一步——創(chuàng)建父表。
在創(chuàng)建分區(qū)表之前應當先創(chuàng)建一張“父表”,所有分區(qū)表都從它繼承,這個表中沒有數據,也不要在這個表上定義任何檢查約束及索引,現(xiàn)在我們就先創(chuàng)建這樣一張表,但之前先建一個序列:
CREATE SEQUENCE "public"."t_sys_log_main_id_seq" INCREMENT 1 MINVALUE 1 MAXVALUE 99999999 START 1 CACHE 1; ALTER TABLE "public"."t_sys_log_main_id_seq" OWNER TO "postgres";
接下來創(chuàng)建“父表”,因為是日志表,所以表名命名為“t_sys_log_main”:
CREATE TABLE "public"."t_sys_log_main" ( "id" int4 DEFAULT nextval('t_sys_log_main_id_seq'::regclass) NOT NULL, "account_affiliation_code" varchar(100) COLLATE "default" NOT NULL, "account_affiliation" varchar(50) COLLATE "default" NOT NULL, "operation_time" timestamp(6) NOT NULL, "operation_key" varchar(2) COLLATE "default" NOT NULL, "operation_value" varchar(30) COLLATE "default" NOT NULL, "operation_loginid" varchar(100) COLLATE "default" NOT NULL, "operation_message" varchar(300) COLLATE "default" NOT NULL, "operation_ip" varchar(30) COLLATE "default" NOT NULL ) WITH (OIDS=FALSE) ; COMMENT ON TABLE "public"."t_sys_log_main" IS '系統(tǒng)日志表'; COMMENT ON COLUMN "public"."t_sys_log_main"."account_affiliation_code" IS '帳號所屬機構代碼'; COMMENT ON COLUMN "public"."t_sys_log_main"."account_affiliation" IS '帳號所屬機構'; COMMENT ON COLUMN "public"."t_sys_log_main"."operation_time" IS '操作時間'; COMMENT ON COLUMN "public"."t_sys_log_main"."operation_key" IS '操作類型(key)'; COMMENT ON COLUMN "public"."t_sys_log_main"."operation_value" IS '操作類型(value)'; COMMENT ON COLUMN "public"."t_sys_log_main"."operation_loginid" IS '操作帳號'; COMMENT ON COLUMN "public"."t_sys_log_main"."operation_message" IS '操作信息'; COMMENT ON COLUMN "public"."t_sys_log_main"."operation_ip" IS '登錄地址'; ALTER TABLE "public"."t_sys_log_main" ADD PRIMARY KEY ("id");
運行以上DDL語句創(chuàng)建父表,創(chuàng)建成功后接下來就可以挨個創(chuàng)建分區(qū)表了,由于每個分區(qū)表都是從父表繼承的,所以分區(qū)表不會增加任何字段,下面我們按需求創(chuàng)建4張分區(qū)子表,分別用于存放9月、10月、11月和12月的日志數據:
create table t_sys_log_y2016m09 (CHECK (operation_time >= DATE '2016-09-01' AND operation_time< DATE '2016-10-01')) INHERITS (t_sys_log_main); create table t_sys_log_y2016m10 (CHECK (operation_time >= DATE '2016-10-01' AND operation_time< DATE '2016-11-01')) INHERITS (t_sys_log_main); create table t_sys_log_y2016m11 (CHECK (operation_time >= DATE '2016-11-01' AND operation_time< DATE '2016-12-01')) INHERITS (t_sys_log_main); create table t_sys_log_y2016m12 (CHECK (operation_time >= DATE '2016-12-01' AND operation_time< DATE '2017-01-01')) INHERITS (t_sys_log_main);
如上所示,運行完成后即可創(chuàng)建4張分區(qū)子表,在上面的語句中我們添加了一個約束表示只允許插入本月的數據,接下來在這4張分區(qū)表的每個分區(qū)鍵上建立索引:
create index t_sys_log_y2016m09_operation_time ON t_sys_log_y2016m09(operation_time); create index t_sys_log_y2016m10_operation_time ON t_sys_log_y2016m10(operation_time); create index t_sys_log_y2016m11_operation_time ON t_sys_log_y2016m11(operation_time); create index t_sys_log_y2016m12_operation_time ON t_sys_log_y2016m12(operation_time);
到此為止我們的分區(qū)表就創(chuàng)建完畢了,接下來需要考慮數據插入的問題,如何才能讓不同日期的數據自動的插入與其對應的分區(qū)子表中呢?有兩種解決方案,分別是:規(guī)則(Rule)和觸發(fā)器(Trigger),相比觸發(fā)器,Rule的開銷更大,所以我在這里就不做過多介紹了,下面直接介紹Trigger的方式。
Trigger通常會結合自定義函數(Function)來實現(xiàn)分區(qū)插入,F(xiàn)unction負責根據條件選擇插入,而Trigger則負責Function的自動調用。首先定義Function,功能很簡單,即根據日期區(qū)間insert數據即可:
CREATE OR REPLACE FUNCTION sys_log_insert_trigger () RETURNS TRIGGER AS $$ BEGIN IF ( NEW .operation_time >= DATE '2016-09-01' AND NEW .operation_time < DATE '2016-10-01' ) THEN INSERT INTO t_sys_log_y2016m09 VALUES (NEW .*) ; ELSEIF ( NEW .operation_time >= DATE '2016-10-01' AND NEW .operation_time < DATE '2016-11-01' ) THEN INSERT INTO t_sys_log_y2016m10 VALUES (NEW .*) ; ELSEIF ( NEW .operation_time >= DATE '2016-11-01' AND NEW .operation_time < DATE '2016-12-01' ) THEN INSERT INTO t_sys_log_y2016m11 VALUES (NEW .*) ; ELSEIF ( NEW .operation_time >= DATE '2016-12-01' AND NEW .operation_time < DATE '2017-01-01' ) THEN INSERT INTO t_sys_log_y2016m12 VALUES (NEW .*) ; ELSE RAISE EXCEPTION 'Date out of range!' ; END IF ; RETURN NULL ; END ; $$ LANGUAGE plpgsql;
最后再創(chuàng)建觸發(fā)器用于執(zhí)行剛才的Function:
CREATE TRIGGER sys_log_insert_trigger BEFORE INSERT ON t_sys_log_main FOR EACH ROW EXECUTE PROCEDURE sys_log_insert_trigger();
到這里就全部創(chuàng)建完成了,最后測試一下看看結果。為了確認我們的觸發(fā)器的確觸發(fā)了,我們打開存儲過程的統(tǒng)計開關,在postgresql.conf中,找到track_functions,改成all:
接下來就可以運行幾條測試insert語句來看看是否能把指定的時間記錄分別插入到與其對應的分區(qū)子表中,插入之前先看下sys_log_insert_trigger()的統(tǒng)計信息:
可以看到目前沒有統(tǒng)計記錄,接下來插入幾條測試數據:
INSERT INTO t_sys_log_main VALUES (1,'200022', '西安高新第一中學初中校區(qū)', '2016-9-8 18:49:26.004', '01', 'xx', 'zhsz_t', 'test!', '127.0.0.1'); INSERT INTO t_sys_log_main VALUES (1,'200023', '西安高新第一中學初中校區(qū)', '2016-9-12 18:49:26.004', '01', 'xx', 'zhsz_t', 'test!', '127.0.0.1'); INSERT INTO t_sys_log_main VALUES (1,'200024', '西安高新第一中學初中校區(qū)', '2016-10-8 18:49:26.004', '01', 'xx', 'zhsz_t', 'test!', '127.0.0.1'); INSERT INTO t_sys_log_main VALUES (1,'200025', '西安高新第一中學初中校區(qū)', '2016-11-8 18:49:26.004', '01', 'xx', 'zhsz_t', 'test!', '127.0.0.1'); INSERT INTO t_sys_log_main VALUES (1,'200026', '西安高新第一中學初中校區(qū)', '2016-12-8 18:49:26.004', '01', 'xx', 'zhsz_t', 'test!', '127.0.0.1'); INSERT INTO t_sys_log_main VALUES (1,'200027', '西安高新第一中學初中校區(qū)', '2016-12-25 18:49:26.004', '01', 'xx', 'zhsz_t', 'test!', '127.0.0.1');
緊接著再看一下sys_log_insert_trigger()的統(tǒng)計信息:
如上圖,可以看出調用了6次函數,因為我們插入了6條數據,至此分區(qū)表由創(chuàng)建到測試的整個過程就已經成功完成了。
總結
簡單記錄一下PostgreSQL創(chuàng)建分區(qū)表的完整步驟以及注意事項,希望對遇到同樣問題的朋友有所幫助,The End。
相關文章
Navicat連接postgresql時出現(xiàn)'datlastsysoid?does?not?exist&
這篇文章主要給大家介紹了關于Navicat連接postgresql時出現(xiàn)'datlastsysoid?does?not?exist'報錯問題的完美解決辦法,文中通過圖文介紹的非常詳細,需要的朋友可以參考下2024-02-02Postgresql 查看SQL語句執(zhí)行效率的操作
這篇文章主要介紹了Postgresql 查看SQL語句執(zhí)行效率的操作,具有很好的參考價值,希望對大家有所幫助。一起跟隨小編過來看看吧2021-02-02PostgreSQL之分區(qū)表(partitioning)
通過合理的設計,可以將選擇一定的規(guī)則,將大表切分多個不重不漏的子表,這就是傳說中的partitioning。比如,我們可以按時間切分,每天一張子表,比如我們可以按照某其他字段分割,總之了就是化整為零,提高查詢的效能2016-11-11PostgreSQL 中 VACUUM 操作的鎖機制詳細對比解析
PostgreSQL 提供了三種主要的 VACUUM 操作:AutoVACUUM、VACUUM 和 VACUUM FULL,它們在鎖機制上有顯著差異,下面給大家分享PostgreSQL 中 VACUUM 操作的鎖機制詳細對比解析,感興趣的朋友一起看看吧2025-05-05postgresql 實現(xiàn)將字段為空的值替換為指定值
這篇文章主要介紹了postgresql 實現(xiàn)將字段為空的值替換為指定值,具有很好的參考價值,希望對大家有所幫助。一起跟隨小編過來看看吧2021-01-01CentOS中運行PostgreSQL需要修改的內核參數及配置腳本分享
這篇文章主要介紹了CentOS中運行PostgreSQL需要修改的內核參數及配置腳本分享,本文從系統(tǒng)資源限制類和內存參數優(yōu)化類來進行說明,需要的朋友可以參考下2014-07-07