快捷導(dǎo)航

如何使用分區(qū)處理MySQL的億級(jí)數(shù)據(jù)優(yōu)化

更新時(shí)間：2021年06月16日 15:14:44 作者：godzla

mysql在查詢上千萬級(jí)數(shù)據(jù)的時(shí)候，通過索引可以解決大部分查詢優(yōu)化問題。但是在處理上億數(shù)據(jù)的時(shí)候，應(yīng)該怎么解決，本文就是用分區(qū)來優(yōu)化一下，感興趣的一起來了解一下

mysql在查詢上千萬級(jí)數(shù)據(jù)的時(shí)候，通過索引可以解決大部分查詢優(yōu)化問題。但是在處理上億數(shù)據(jù)的時(shí)候，索引就不那么友好了。

數(shù)據(jù)表（日志）是這樣的：

表大?。?T，約24億行；
表分區(qū)：按時(shí)間分區(qū)，每個(gè)月為一個(gè)分區(qū)，一個(gè)分區(qū)約2-3億行數(shù)據(jù)（40-70G左右）。

由于數(shù)據(jù)不需要全量處理，經(jīng)過與需求方討論后，我們按時(shí)間段抽樣一部分?jǐn)?shù)據(jù)，比如抽樣一個(gè)月的數(shù)據(jù)，約3.5億行。
數(shù)據(jù)處理的思路：

1）建表引擎選擇Innodb。由于數(shù)據(jù)是按月分區(qū)的，我們將該月分區(qū)的數(shù)據(jù)單獨(dú)copy出來，源表為myisam引擎，因我們可能需要過濾部分?jǐn)?shù)據(jù)，涉及到篩選的字段又沒有索引，使用myisam引擎加索引的速度會(huì)比較慢；
2）按日分區(qū)。將copy出來的表加好索引后（約2-4個(gè)小時(shí)），過濾掉無用的數(shù)據(jù)，同時(shí)再次新生成一張表，抽取json中需要的字段，并對(duì)該表按日分區(qū)。

CREATE TABLE `tb_name` (
  `id_`,
  ...,
  KEY `idx_1` (`create_user_`) 
) ENGINE=InnoDB DEFAULT CHARSET=utf8 COMMENT='應(yīng)用日志'
PARTITION BY RANGE(to_days(log_time_)) (
    PARTITION p1231 VALUES LESS THAN (737425),
    PARTITION p0101 VALUES LESS THAN (737426),
    PARTITION p0102 VALUES LESS THAN (737427),
    PARTITION p0103 VALUES LESS THAN (737428),
    PARTITION p0104 VALUES LESS THAN (737429),
......
);

3）對(duì)上面生成的表按每日進(jìn)行聚合或者其他操作，并將結(jié)果存儲(chǔ)到臨時(shí)表中，盡量使用存儲(chǔ)過程加工數(shù)據(jù)，由于加工相對(duì)復(fù)雜而且耗時(shí)較多（跑一次存儲(chǔ)過程需要大概1-2小時(shí)），因此循環(huán)調(diào)用存儲(chǔ)過程時(shí)應(yīng)記錄操作時(shí)間和執(zhí)行過程中的參數(shù)等；

delimiter $$
create procedure proc_name(param varchar(50))
begin
 declare start_date date;
    declare end_date date;
    set start_date = '2018-12-31';
    set end_date = '2019-02-01';
    
    start transaction;
 truncate tmp_talbe;
 commit;
    
    while start_date < end_date do
  set @partition_name = date_format(start_date, '%m%d');
        set @start_time = now(); -- 記錄當(dāng)前分區(qū)操作起始時(shí)間
        
  start transaction;
  set @sqlstr = concat(
   "insert into tmp_talbe",
   "select field_names ",
            "from tb_name partition(p", @partition_name,") t ",
            "where conditions;"
   );
  -- select @sqlstr;
  prepare stmt from @sqlstr;  
  execute stmt;
  deallocate prepare stmt;
  commit;
        
        -- 插入日志
        set @finish_time = now(); -- 操作結(jié)束時(shí)間
        insert into oprerate_log values(param, @partition_name, @start_time, @finish_time, timestampdiff(second, @start_time, @finish_time));
        
  set start_date = date_add(start_date, interval 1 day);
    end while;
end
$$
delimiter ;

4）對(duì)上述生成的結(jié)果進(jìn)行整理加工。

總的來說，處理過程相對(duì)繁瑣，而且產(chǎn)生了很多中間表，對(duì)關(guān)鍵步驟還需要記錄操作流程的元數(shù)據(jù)，這對(duì)SQL處理的要求會(huì)比較高，因此不建議使用MySQL處理這種任務(wù)（除非迫不得已），如果能將能處理過程放在大數(shù)據(jù)平臺(tái)上處理，速度會(huì)更快，而且元數(shù)據(jù)管理會(huì)相對(duì)專業(yè)。

到此這篇關(guān)于如何使用分區(qū)處理MySQL的億級(jí)數(shù)據(jù)優(yōu)化的文章就介紹到這了,更多相關(guān)MySQL 億級(jí)數(shù)據(jù)優(yōu)化內(nèi)容請(qǐng)搜索腳本之家以前的文章或繼續(xù)瀏覽下面的相關(guān)文章希望大家以后多多支持腳本之家！

您可能感興趣的文章:

相關(guān)文章

MySQL全量備份的實(shí)現(xiàn)
全量備份是MySQL數(shù)據(jù)庫備份的常見方式,本文主要介紹了MySQL全量備份的實(shí)現(xiàn),全量備份和增量備份是 MySQL 數(shù)據(jù)庫備份的兩種常見方式
2024-04-04
mysql誤刪數(shù)據(jù)后快速恢復(fù)的辦法推薦
手抖不小心把表里的數(shù)據(jù)刪除或修改錯(cuò)誤怎么辦?該如何快速恢復(fù)呢?遇到這樣的問題怎么辦?下面這篇文章主要給大家介紹了關(guān)于mysql誤刪數(shù)據(jù)后快速恢復(fù)的相關(guān)資料,需要的朋友可以參考下
2023-02-02
這篇文章主要給大家介紹了關(guān)于mysql索引使用率監(jiān)控技巧的相關(guān)資料，文中通過示例代碼介紹的非常詳細(xì)，對(duì)大家學(xué)習(xí)或者使用mysql具有一定的參考學(xué)習(xí)價(jià)值，需要的朋友們下面來一起學(xué)習(xí)學(xué)習(xí)吧
2019-09-09

MySQL max_allowed_packet的坑

max_allowed_packet是 MySQL 中的一個(gè)設(shè)定參數(shù),用于設(shè)定所接受的包的大小,根據(jù)情形不同,其缺省值可能是 1M 或者 4M,本文主要介紹了MySQL max_allowed_packet的坑,感興趣的可以了解一下

2024-01-01

MySQL需要根據(jù)特定順序排序的實(shí)現(xiàn)方法

在MySQL中,我們可以通過指定順序排序來在查詢結(jié)果中控制數(shù)據(jù)的排列順序,這種排序方式是非常有用的,本文就來介紹一下,感興趣的可以了解一下

2023-11-11

CentOS6.9+Mysql5.7.18源碼安裝詳細(xì)教程

CentOS6.9+Mysql5.7.18源碼安裝，以下操作均在root用戶下執(zhí)行。下面通過本教程給大家詳細(xì)介紹CentOS6.9+Mysql5.7.18源碼安裝方法，需要的的朋友參考下吧

2017-06-06

mysql now()函數(shù)調(diào)用系統(tǒng)時(shí)間不對(duì)的解決方法

mysql的now()函數(shù)與實(shí)際時(shí)間不符，本文就詳細(xì)的介紹一下mysql now()函數(shù)調(diào)用系統(tǒng)時(shí)間不對(duì)的解決方法，非常具有實(shí)用價(jià)值，需要的朋友可以參考下

2023-05-05

關(guān)于Mysql8.0版本驅(qū)動(dòng)getTables返回所有庫的表問題淺析

這篇文章主要給大家介紹了關(guān)于Mysql 8.0版本驅(qū)動(dòng)getTables返回所有庫的表問題的相關(guān)資料，文中通過示例代碼介紹的非常詳細(xì)，對(duì)大家的學(xué)習(xí)或者工作具有一定的參考學(xué)習(xí)價(jià)值，需要的朋友們下面隨著小編來一起學(xué)習(xí)學(xué)習(xí)吧

2018-12-12

mysql安裝navicat之后,出現(xiàn)2059,Authentication plugin及本地鏈接虛擬機(jī)docker,

這篇文章主要介紹了mysql安裝navicat之后,出現(xiàn)2059,Authentication plugin及本地鏈接虛擬機(jī)docker,遠(yuǎn)程鏈接服務(wù)器,需要的朋友可以參考下

2020-06-06

MySQL 分組查詢的優(yōu)化方法

這篇文章主要介紹了MySQL 分組查詢的優(yōu)化方法，幫助大家更好的理解和學(xué)習(xí)使用MySQL，感興趣的朋友可以了解下

2021-05-05

欧美bbbwbbbw肥妇,免费乱码人妻系列日韩,一级黄片

如何使用分區(qū)處理MySQL的億級(jí)數(shù)據(jù)優(yōu)化

相關(guān)文章

最新評(píng)論

大家感興趣的內(nèi)容

最近更新的內(nèi)容

常用在線小工具