mysql表分區(qū)的使用與底層原理詳解

更新時間：2021年08月04日 12:56:47 作者：java葉新東老師

通俗地講表分區(qū)是將一大表,根據(jù)條件分割成若干個小表,mysql5.1開始支持數(shù)據(jù)表分區(qū)了,這篇文章主要給大家介紹了關(guān)于mysql表分區(qū)的使用與底層原理的相關(guān)資料,需要的朋友可以參考下

什么是分區(qū)表

MySQL從5.1版本開始支持分區(qū)功能，分區(qū)是將一個表的數(shù)據(jù)按照某種方式，比如按照時間上的月份，分成多個較小的，更容易管理的部分，但是邏輯上仍是一個表。

還沒出現(xiàn)分區(qū)表的時候，所有的數(shù)據(jù)都是存放在一個文件里面的，如果數(shù)據(jù)量太大，查詢數(shù)據(jù)時總是避免不了需要大量io操作；使用分區(qū)表后，每個分區(qū)存放不同的數(shù)據(jù)。這樣不但可以減少io。還可以加快數(shù)據(jù)的訪問；

為了保證MySQL的性能，我們都建議mysql單表不要太大，建議是：單表小于2G，記錄數(shù)小于1千萬，十庫百表。如果但行記錄數(shù)非常小，那么記錄數(shù)可以再偏大些，反之，可能記錄數(shù)到百萬級別就開始變慢了。

那么，業(yè)務(wù)量在增長，數(shù)據(jù)到瓶頸了怎么辦呢，除了使用分布式數(shù)據(jù)庫，我們也可以自行分庫分表，或者利用mysql的分區(qū)功能實現(xiàn)。

分區(qū)表的出現(xiàn)是為了分而治之的概念，分區(qū)表的用處非常大，只是現(xiàn)在還有很多人都不知道；
將一個表設(shè)置為分區(qū)表后，會在數(shù)據(jù)文件.idb的文件名加上#號，代表這是一個分區(qū)表；

分區(qū)表應(yīng)用場景

表非常大以至于無法全部放在內(nèi)存中，或者只在表的最后部分有熱點數(shù)據(jù)，其他都是歷史數(shù)據(jù)
分區(qū)表的數(shù)據(jù)更容易維護，，能批量刪除大量數(shù)據(jù)
對一個獨立分區(qū)進行優(yōu)化、檢查、修復(fù)等操作
分區(qū)表的數(shù)據(jù)可以分布在不同的設(shè)備上，從未高效的利用多個硬件設(shè)備
可以備份和恢復(fù)獨立的分區(qū)；

分區(qū)表的限制

一個表最多能有1024個分區(qū)，在5.7版本及以上可以有8196個分區(qū)
在早期mysql中，分區(qū)表達式必須是整數(shù)或者整返回整數(shù)的表達式，在mysql5.5中，某些場景可以直接使用列來進行分區(qū)
分區(qū)表無法使用外檢約束
最好不要去修改分區(qū)列
如果分區(qū)字段中有主鍵或者唯一索引的列，那么所有主鍵列和唯一索引列都必須包含進來；就像這樣：

-- 創(chuàng)建分區(qū)必須包含所有主鍵
create table user_11(
  id bigint(20) not null ,
  name varchar(20) ,
  age int(3),
	PRIMARY KEY (`id`,`age`)
)
-- 創(chuàng)建分區(qū)
partition by range columns(id,age)(
  partition p00 values less than(6,30), -- 小于6的值在P0分區(qū)
  partition p11 values less than(11,40), -- 小于11的值在p1分區(qū)
  partition p22 values less than(16,50), -- 小于16的值在p2分區(qū)
  partition p33 values less than (9999,9999) -- 大于21的值在p3分區(qū)，或者用一個更大的值
);

-- 創(chuàng)建分區(qū)必須包含所有唯一鍵
create table user_22(
  id bigint(20)  not null,
  name varchar(20) ,
  age int(3) not null ,
	unique key only_one_1(age,id )
)
-- 創(chuàng)建分區(qū)
partition by range columns(id,age)(
  partition p000 values less than(6,30), -- 小于6的值在P0分區(qū)
  partition p111 values less than(11,40), -- 小于11的值在p1分區(qū)
  partition p222 values less than(16,50), -- 小于16的值在p2分區(qū)
  partition p333 values less than (9999,9999) -- 大于21的值在p3分區(qū)，或者用一個更大的值
);

分區(qū)類型

范圍分區(qū)
列表分區(qū)
列分區(qū)
hash分區(qū)
秘鑰分區(qū)
子分區(qū)

分區(qū)表的使用

1、范圍分區(qū)

下面示例中將年齡進行分區(qū)，

create table employees(
id bigint(20) not null,
age int(3) not null,
name varchar(20)
)
-- 創(chuàng)建分區(qū)
partition by range (age)(
  partition p0 values less than(6), -- 小于6的值在P0分區(qū)
  partition p1 values less than(11), -- 小于11的值在p1分區(qū)
  partition p2 values less than(16), -- 小于16的值在p2分區(qū)
  partition p3 values less than(21) -- 小于21的值在p3分區(qū)
);

創(chuàng)建好之后，就可以看到在數(shù)據(jù)文件夾中的分區(qū)文件了

[root@VM_0_5_centos test]# pwd
/var/lib/mysql/test
[root@VM_0_5_centos test]# ll
總用量 8741504
-rw-rw---- 1 mysql mysql         61 10月 31 2018 db.opt
-rw-rw---- 1 mysql mysql       8614 8月   1 21:30 employees.frm
-rw-rw---- 1 mysql mysql         32 8月   1 21:30 employees.par
-rw-rw---- 1 mysql mysql      98304 8月   1 21:30 employees#P#p0.ibd
-rw-rw---- 1 mysql mysql      98304 8月   1 21:30 employees#P#p1.ibd
-rw-rw---- 1 mysql mysql      98304 8月   1 21:30 employees#P#p2.ibd
-rw-rw---- 1 mysql mysql      98304 8月   1 21:30 employees#P#p3.ibd

因為age字段最大只能插入21以下的數(shù)字，如果插入21的數(shù)字則會報錯，

mysql> insert employees (id,name,age) values(1,'yexindong',21);
ERROR 1526 (HY000): Table has no partition for value 21

所以，為了解決這個問題，在建表的時候可以這么干，將最大的值使用maxvalue，據(jù)說maxvalue的值為28個9，也就是9999999999999999999999999999

create table employees(
id bigint(20) not null,
age int(3) not null,
name varchar(20)
)
-- 創(chuàng)建分區(qū)
partition by range (age)(
  partition p0 values less than(6), -- 小于6的值在P0分區(qū)
  partition p1 values less than(11), -- 小于11的值在p1分區(qū)
  partition p2 values less than(16), -- 小于16的值在p2分區(qū)
  partition p3 values less than maxvalue -- 大于16的值在p3分區(qū)，或者用一個更大的值
);

時間范圍分區(qū)

CREATE TABLE employees (
    id INT NOT NULL,
    fname VARCHAR(30),
    lname VARCHAR(30),
    hired DATE NOT NULL DEFAULT '1970-01-01',
    separated DATE NOT NULL DEFAULT '9999-12-31',
    job_code INT,
    store_id INT
)
PARTITION BY RANGE ( YEAR(separated) ) (
    PARTITION p0 VALUES LESS THAN (1991), -- 1991年之前的數(shù)據(jù)在P0分區(qū)
    PARTITION p1 VALUES LESS THAN (1996),-- 1996年之前的數(shù)據(jù)在P1分區(qū)
    PARTITION p2 VALUES LESS THAN (2001),-- 2001年之前的數(shù)據(jù)在P2分區(qū)
    PARTITION p3 VALUES LESS THAN MAXVALUE -- 2001年制后的數(shù)據(jù)在P3分區(qū)
);

CREATE TABLE members (
    firstname VARCHAR(25) NOT NULL,
    lastname VARCHAR(25) NOT NULL,
    username VARCHAR(16) NOT NULL,
    email VARCHAR(35),
    joined DATE NOT NULL
)
PARTITION BY RANGE COLUMNS(joined) (
    PARTITION p0 VALUES LESS THAN ('1960-01-01'),
    PARTITION p1 VALUES LESS THAN ('1970-01-01'),
    PARTITION p2 VALUES LESS THAN ('1980-01-01'),
    PARTITION p3 VALUES LESS THAN ('1990-01-01'),
    PARTITION p4 VALUES LESS THAN MAXVALUE
);

2、列表分區(qū)（list分區(qū)）

列表分區(qū)和范圍分區(qū)最大的區(qū)別就是列表是等值的，而范圍分區(qū)是在某個范圍內(nèi)的；

CREATE TABLE employees (
    id INT NOT NULL,
    fname VARCHAR(30),
    lname VARCHAR(30),
    hired DATE NOT NULL DEFAULT '1970-01-01',
    separated DATE NOT NULL DEFAULT '9999-12-31',
    job_code INT,
    store_id INT
)
PARTITION BY LIST(store_id) (
    PARTITION pNorth VALUES IN (3,5,6,9,17), -- 3,5,6,9,17的值放在pNorth分區(qū)
    PARTITION pEast VALUES IN (1,2,10,11,19,20),-- 1,2,10,11,19,20的值放在pEast分區(qū)
    PARTITION pWest VALUES IN (4,12,13,14,18),-- 4,12,13,14,18的值放在pWest分區(qū)
    PARTITION pCentral VALUES IN (7,8,15,16)-- 7,8,15,16的值放在pCentral分區(qū)
);

3、列分區(qū)

列分區(qū)是范圍分區(qū)和列表分區(qū)的變體，也就是說列分區(qū)就是由范圍分區(qū)和列表分區(qū)封裝得來的，唯一的不同的是，列分區(qū)沒有數(shù)據(jù)類型的限制，換句話說，范圍分區(qū)和列表分區(qū)就是列分區(qū)；

4、hash分區(qū)

hash分區(qū)不需要指定范圍或者列表，而是根據(jù)插入的值動態(tài)分配來決定插入到哪個分區(qū)，和hashMap的原理很像，不同的是hashMap會通過擾動函數(shù)來解決hash碰撞問題，但是mysql的hash分區(qū)是直接取模運算得出結(jié)果；然后插入指定位置的分區(qū)；

-- 普通字段的分區(qū)
CREATE TABLE employees (
    id INT NOT NULL,
    fname VARCHAR(30),
    lname VARCHAR(30),
    hired DATE NOT NULL DEFAULT '1970-01-01',
    separated DATE NOT NULL DEFAULT '9999-12-31',
    job_code INT,
    store_id INT
)
PARTITION BY HASH(store_id)
PARTITIONS 5;--創(chuàng)建5個分區(qū)，分別是0，1，2，3，4

-- 創(chuàng)建時間類型的分區(qū)
CREATE TABLE employees (
    id INT NOT NULL,
    fname VARCHAR(30),
    lname VARCHAR(30),
    hired DATE NOT NULL DEFAULT '1970-01-01',
    separated DATE NOT NULL DEFAULT '9999-12-31',
    job_code INT,
    store_id INT
)
PARTITION BY HASH( YEAR(hired) )
PARTITIONS 4; -- 創(chuàng)建四個分區(qū)，分別為0，1，2，3

5、秘鑰分區(qū)（key分區(qū)）

key分區(qū)用的比較少

-- 以主鍵進行分區(qū)
CREATE TABLE k1 (
    id INT NOT NULL PRIMARY KEY,
    name VARCHAR(20)
)
PARTITION BY KEY()
PARTITIONS 2; -- 創(chuàng)建2個分區(qū)分別為P0和P1，這里是hash分區(qū)的變種，存儲方式和hash分區(qū)一樣


-- 以唯一鍵進行分區(qū)
CREATE TABLE k1 (
    id INT NOT NULL,
    name VARCHAR(20),
    UNIQUE KEY (id)
)
PARTITION BY KEY()
PARTITIONS 3;-- 創(chuàng)建三個分區(qū)，分別是p0，p1，p2

-- 指定主鍵字段進行分區(qū)
CREATE TABLE tm1 (
    s1 CHAR(32) PRIMARY KEY
)
PARTITION BY KEY(s1)
PARTITIONS 10; -- 創(chuàng)建10個分區(qū)

6、子分區(qū)

子分區(qū)這么理解就行了：在分區(qū)的基礎(chǔ)上在分區(qū)；舉個例子吧，如果一張表分成三個分區(qū)，而每個分區(qū)又有三個子分區(qū)，所以一共有3 * 3 = 9個分區(qū)；

 -- 表中有3個分區(qū)，每個分區(qū)上有2個子分區(qū)，所以加起來一共有6個分區(qū)
CREATE TABLE ts (id INT, purchased DATE)
    PARTITION BY RANGE( YEAR(purchased) )
    SUBPARTITION BY HASH( TO_DAYS(purchased) )
    SUBPARTITIONS 2 (
        PARTITION p0 VALUES LESS THAN (1990),
        PARTITION p1 VALUES LESS THAN (2000),
        PARTITION p2 VALUES LESS THAN MAXVALUE
    );

進入mysql的數(shù)據(jù)文件中就可以看到有6個文件,顧名思義，生成了6個分區(qū)

-rw-rw---- 1 mysql mysql      98304 8月   2 22:37 ts#P#p0#SP#p0sp0.ibd
-rw-rw---- 1 mysql mysql      98304 8月   2 22:37 ts#P#p0#SP#p0sp1.ibd
-rw-rw---- 1 mysql mysql      98304 8月   2 22:37 ts#P#p1#SP#p1sp0.ibd
-rw-rw---- 1 mysql mysql      98304 8月   2 22:37 ts#P#p1#SP#p1sp1.ibd
-rw-rw---- 1 mysql mysql      98304 8月   2 22:37 ts#P#p2#SP#p2sp0.ibd
-rw-rw---- 1 mysql mysql      98304 8月   2 22:37 ts#P#p2#SP#p2sp1.ibd

添加分區(qū)

-- 添加列表分區(qū)
alter table titles add partition(partition p7 values in('CEO'));

分區(qū)表原理

分區(qū)表由多個相關(guān)的底層表實現(xiàn)，這個底層表也是由句柄對象標(biāo)識，我們可以直接訪問各個分區(qū)。存儲引擎管理分區(qū)的各個底層表和管理普通表一樣（所有的底層表都必須使用相同的存儲引擎），分區(qū)表的索引知識在各個底層表上各自加上一個完全相同的索引。從存儲引擎的角度來看，底層表和普通表沒有任何不同，存儲引擎也無須知道這是一個普通表還是一個分區(qū)表的一部分。

分區(qū)表的操作按照以下的操作邏輯進行：

select查詢

當(dāng)查詢一個分區(qū)表的時候，分區(qū)層先打開并鎖住所有的底層表，優(yōu)化器先判斷是否可以過濾部分分區(qū)，然后再調(diào)用對應(yīng)的存儲引擎接口訪問各個分區(qū)的數(shù)據(jù)

insert操作

當(dāng)寫入一條記錄的時候，分區(qū)層先打開并鎖住所有的底層表，然后確定哪個分區(qū)接受這條記錄，再將記錄寫入對應(yīng)底層表

delete操作

當(dāng)刪除一條記錄時，分區(qū)層先打開并鎖住所有的底層表，然后確定數(shù)據(jù)對應(yīng)的分區(qū)，最后對相應(yīng)底層表進行刪除操作

update操作

當(dāng)更新一條記錄時，分區(qū)層先打開并鎖住所有的底層表，mysql先確定需要更新的記錄再哪個分區(qū)，然后取出數(shù)據(jù)并更新，再判斷更新后的數(shù)據(jù)應(yīng)該再哪個分區(qū)，最后對底層表進行寫入操作，并對源數(shù)據(jù)所在的底層表進行刪除操作

有些操作時支持過濾的，例如，當(dāng)刪除一條記錄時，MySQL需要先找到這條記錄，如果where條件恰好和分區(qū)表達式匹配，就可以將所有不包含這條記錄的分區(qū)都過濾掉，這對update同樣有效。如果是insert操作，則本身就是只命中一個分區(qū)，其他分區(qū)都會被過濾掉。mysql先確定這條記錄屬于哪個分區(qū)，再將記錄寫入對應(yīng)得曾分區(qū)表，無須對任何其他分區(qū)進行操作

雖然每個操作都會“先打開并鎖住所有的底層表”，但這并不是說分區(qū)表在處理過程中是鎖住全表的，如果存儲引擎能夠自己實現(xiàn)行級鎖，例如innodb，則會在分區(qū)層釋放對應(yīng)表鎖。

如何使用分區(qū)表

日志系統(tǒng)可以用分區(qū)，一般日志數(shù)量都是比較多的，按年或者月份來分區(qū)，一般來說都需要在日志系統(tǒng)中查詢出某一段時間的歷史記錄，因為數(shù)據(jù)量巨大，肯定不能走全表掃描，全表掃描會引發(fā)大量的隨機io，當(dāng)數(shù)據(jù)量超大的時候，索引也無法起作用；此時應(yīng)該考慮用分區(qū)進行解決；
并不是數(shù)據(jù)量大才需要用分區(qū)，數(shù)據(jù)量小的時候也可以用分區(qū)，怎樣的場景下數(shù)據(jù)量小呢？答案是你每次查詢的數(shù)據(jù)都是某一個批次的時候就可以用分區(qū)，比如說字典，業(yè)務(wù)的字典和用戶類型的字典一般都是存放在同一張表里面的，且你每次查詢的時候不是差一個業(yè)務(wù)或者一個用戶類型，而是查詢整個業(yè)務(wù)或者用戶類型，這就是一個批次，此時也可以用分區(qū)來實現(xiàn)；
使用分區(qū)后，就可以不用索引了，因為一般使用分區(qū)的話都是范圍查詢，范圍查詢也就沒必要使用索引了；已經(jīng)將數(shù)據(jù)分布在不同的分區(qū)中了；
要使用索引的話，也可以，但是要分離熱數(shù)據(jù)和冷數(shù)據(jù)，熱數(shù)據(jù)就是經(jīng)常要查詢的數(shù)據(jù)，在熱數(shù)據(jù)的表上加索引來加快訪問速度；

注意事項

null值會使分區(qū)過濾無效；分區(qū)是需要制定列名的，需要確保這個列名不會出現(xiàn)null值；
如果分區(qū)列和索引列不是同一列的話，會導(dǎo)致查詢無法進行分區(qū)過濾，比如說你的id和age字段都加了索引，那么分區(qū)的時候最好把這2個列設(shè)為分區(qū)列：干PARTITION BY RANGE COLUMNS(id,age)
對分區(qū)表增刪改的成本很高，每次對表進行次增刪改的時候會打開并鎖住所有的底層表，只要有一個鎖住了，其他的操作就無法進行；
維護分區(qū)的時候，成本可能很高，特別是需要修改分區(qū)的時候，成本是最高的，

總結(jié)

到此這篇關(guān)于mysql表分區(qū)的使用與底層原理的文章就介紹到這了,更多相關(guān)mysql表分區(qū)底層原理內(nèi)容請搜索腳本之家以前的文章或繼續(xù)瀏覽下面的相關(guān)文章希望大家以后多多支持腳本之家！

您可能感興趣的文章:

欧美bbbwbbbw肥妇,免费乱码人妻系列日韩,一级黄片

mysql表分區(qū)的使用與底層原理詳解

目錄

什么是分區(qū)表

分區(qū)表應(yīng)用場景

分區(qū)表的限制

分區(qū)類型

分區(qū)表的使用

1、范圍分區(qū)

2、列表分區(qū)（list分區(qū)）

3、列分區(qū)

4、hash分區(qū)

5、秘鑰分區(qū)（key分區(qū)）

6、子分區(qū)

添加分區(qū)

分區(qū)表原理

如何使用分區(qū)表

注意事項

總結(jié)

相關(guān)文章

最新評論

大家感興趣的內(nèi)容

最近更新的內(nèi)容

常用在線小工具

欧美bbbwbbbw肥妇,免费乱码人妻系列日韩,一级黄片

mysql表分區(qū)的使用與底層原理詳解

目錄

什么是分區(qū)表

分區(qū)表應(yīng)用場景

分區(qū)表的限制

分區(qū)類型

分區(qū)表的使用

1、范圍分區(qū)

2、列表分區(qū)（list分區(qū)）

3、列分區(qū)

4、hash分區(qū)

5、秘鑰分區(qū)（key分區(qū)）

6、子分區(qū)

添加分區(qū)

分區(qū)表原理

如何使用分區(qū)表

注意事項

總結(jié)

相關(guān)文章

最新評論

大家感興趣的內(nèi)容

最近更新的內(nèi)容

常用在線小工具

1、范圍分區(qū)

2、列表分區(qū)（list分區(qū)）

3、列分區(qū)

5、秘鑰分區(qū)（key分區(qū)）