詳解PostgreSQL提升批量數(shù)據(jù)導(dǎo)入性能的n種方法
關(guān)鍵字:批量數(shù)據(jù)導(dǎo)入,數(shù)據(jù)加載,大量插入,加快,提升速度
多元化選擇時代,人生里很多事物都是如此,凡事都沒有一成不變的方式和方法。不管白貓黑貓,能抓老鼠的就是好貓,適合自己的就是最好的。
提升批量數(shù)據(jù)導(dǎo)入的方法亦是如此,沒有何種方法是最優(yōu)的,應(yīng)用任何方法前根據(jù)自己的實(shí)際情況權(quán)衡利弊,做出選擇。
批量導(dǎo)入數(shù)據(jù)之前,無論采取何種方式,務(wù)必做好相應(yīng)的備份。
導(dǎo)入完成后亦需對相應(yīng)對象進(jìn)行ANALYZE操作,這樣查詢優(yōu)化器才會按照最新的統(tǒng)計信息生成正確的執(zhí)行計劃。
下面正式介紹提升批量數(shù)據(jù)導(dǎo)入性能的n種方法。
方法1:禁用自動提交。
psql \set AUTOCOMMIT off 其他 BEGIN; 執(zhí)行批量數(shù)據(jù)導(dǎo)入 COMMIT;
方法2:設(shè)置表為UNLOGGED。
導(dǎo)入數(shù)據(jù)之前先把表改成UNLOGGED模式,導(dǎo)入完成后改回LOGGED模式。
ALTER TABLE tablename SET UNLOGGED; 執(zhí)行批量數(shù)據(jù)導(dǎo)入 ALTER TABLE tablename LOGGED;
優(yōu)點(diǎn):
導(dǎo)入信息不記錄WAL日志,極大減少io,提升導(dǎo)入速度。
缺點(diǎn):
1.在replication環(huán)境下,表無法設(shè)置為UNLOGGED模式。
2.導(dǎo)入過程一旦出現(xiàn)停電死機(jī)等會導(dǎo)致數(shù)據(jù)庫不能干凈關(guān)庫的情況,數(shù)據(jù)庫中所有UNLOGGED表的數(shù)據(jù)將丟失。
方法3:重建索引。
導(dǎo)入數(shù)據(jù)之前先刪除相關(guān)表上的索引,導(dǎo)入完成后重新創(chuàng)建之。
DROP INDEX indexname; 執(zhí)行批量數(shù)據(jù)導(dǎo)入 CREATE INDEX ...;
查詢表上索引定義的方法
select * from pg_indexes where tablename ='tablename' and schemaname = 'schemaname';
方法4:重建外鍵。
導(dǎo)入數(shù)據(jù)之前先刪除相關(guān)表上的外鍵,導(dǎo)入完成后重新創(chuàng)建之。
ALTER TABLE ... DROP CONSTRAINT ... ; 執(zhí)行批量數(shù)據(jù)導(dǎo)入 ALTER TABLE ... ADD CONSTRAINT ... FOREIGN KEY ... REFERENCES ...;
相關(guān)信息可查詢pg_constraint。
方法5:停用觸發(fā)器
導(dǎo)入數(shù)據(jù)之前先DISABLE掉相關(guān)表上的觸發(fā)器,導(dǎo)入完成后重新ENABLE之。
ALTER TABLE tablename DISABLE TRIGGER ALL; 執(zhí)行批量數(shù)據(jù)導(dǎo)入 ALTER TABLE tablename ENABLE TRIGGER ALL;
相關(guān)信息可查詢pg_trigger。
方法6:insert改copy
COPY針對批量數(shù)據(jù)加載進(jìn)行了優(yōu)化。
COPY ... FROM 'xxx';
方法7:單值insert改多值insert
減少sql解析的時間。
方法8:insert改PREPARE
通過使用PREPARE預(yù)備語句,降低解析消耗。
PREPARE fooplan (int, text, bool, numeric) AS INSERT INTO foo VALUES($1, $2, $3, $4); EXECUTE fooplan(1, 'Hunter Valley', 't', 200.00);
方法9:修改參數(shù)
增大maintenance_work_mem,增大max_wal_size。
方法10:關(guān)閉歸檔模式,降低wal日志級別。
修改archive_mode參數(shù)控制歸檔開啟和關(guān)閉。降低wal_level值為minimal來減少日志信息記錄。
此法需要重啟數(shù)據(jù)庫,需要規(guī)劃停機(jī)時間。此外如有replication備庫,還需考慮對其影響。
到此這篇關(guān)于PostgreSQL提升批量數(shù)據(jù)導(dǎo)入性能的n種方法的文章就介紹到這了,更多相關(guān)PostgreSQL批量數(shù)據(jù)導(dǎo)入內(nèi)容請搜索腳本之家以前的文章或繼續(xù)瀏覽下面的相關(guān)文章希望大家以后多多支持腳本之家!
相關(guān)文章
Docker環(huán)境下升級PostgreSQL的步驟方法詳解
這篇文章主要介紹了Docker環(huán)境下升級PostgreSQL的步驟方法詳解,本文給大家介紹的非常詳細(xì),對大家的學(xué)習(xí)或工作具有一定的參考借鑒價值,需要的朋友可以參考下2021-01-01Postgresql排序與limit組合場景性能極限優(yōu)化詳解
這篇文章主要介紹了Postgresql排序與limit組合場景性能極限優(yōu)化詳解,具有很好的參考價值,希望對大家有所幫助。一起跟隨小編過來看看吧2020-12-12Postgresql數(shù)據(jù)庫中的json類型字段使用示例詳解
JSON的主要用于在服務(wù)器與web應(yīng)用之間傳輸數(shù)據(jù),這篇文章主要介紹了Postgresql數(shù)據(jù)庫中的json類型字段使用,本文結(jié)合實(shí)例代碼給大家介紹的非常詳細(xì),對大家的學(xué)習(xí)或工作具有一定的參考借鑒價值,需要的朋友可以參考下2023-02-02PostgreSQL時間相差天數(shù)代碼實(shí)例
PostgreSQL是一款簡介而又性能強(qiáng)大的數(shù)據(jù)庫應(yīng)用程序,其在日期時間數(shù)據(jù)方面所支持的功能也都非常給力,這篇文章主要給大家介紹了關(guān)于PostgreSQL時間相差天數(shù)的相關(guān)資料,需要的朋友可以參考下2023-11-11PostgreSQL?16?新特性之正態(tài)分布隨機(jī)數(shù)函數(shù)的示例
這篇文章主要介紹了PostgreSQL?16?新特性之正態(tài)分布隨機(jī)數(shù)函數(shù),PostgreSQL 16 新增了一個內(nèi)置的 random_normal() 函數(shù),用于生成這種隨機(jī)數(shù),通過示例代碼給大家介紹的非常詳細(xì),需要的朋友可以參考下2023-01-01postgreSQL數(shù)據(jù)庫 實(shí)現(xiàn)向表中快速插入1000000條數(shù)據(jù)
這篇文章主要介紹了postgreSQL數(shù)據(jù)庫 實(shí)現(xiàn)向表中快速插入1000000條數(shù)據(jù),具有很好的參考價值,希望對大家有所幫助。一起跟隨小編過來看看吧2020-12-12