欧美bbbwbbbw肥妇,免费乱码人妻系列日韩,一级黄片

MySQL Group by的優(yōu)化詳解

 更新時間:2021年03月09日 11:11:57   作者:萌新J  
這篇文章主要介紹了MySQL Group by 優(yōu)化的相關(guān)資料,幫助大家更好的理解和學(xué)習(xí)使用MySQL,感興趣的朋友可以了解下

一個標(biāo)準(zhǔn)的 Group by 語句包含排序、分組、聚合函數(shù),比如 select a,count(*) from t group by a ;  這個語句默認(rèn)使用 a 進(jìn)行排序。如果 a 列沒有索引,那么就會創(chuàng)建臨時表來統(tǒng)計 a和 count(*),然后再通過 sort_buffer 按 a 進(jìn)行排序。

標(biāo)準(zhǔn)的執(zhí)行流程

結(jié)構(gòu):

create table t1(id int primary key, a int, b int, index(a));
delimiter ;;
create procedure idata()
begin
 declare i int;

 set i=1;
 while(i<=1000)do
 insert into t1 values(i, i, i);
 set i=i+1;
 end while;
end;;
delimiter ;
call idata();

函數(shù)就是向 t1 中插入1000條語句,從(1,1,1) 到(1000,1000,1000)。

執(zhí)行   select id%10 as m, count(*) as c from t1 group by m;

解析:

Using index,表示這個語句使用了覆蓋索引,選擇了索引 a,不需要回表;
Using temporary,表示使用了臨時表;
Using filesort,表示需要排序。

過程:

1、創(chuàng)建內(nèi)存臨時表,表里有兩個字段 m 和 c,主鍵是 m;
2、掃描表 t1 的索引 a,依次取出葉子節(jié)點(diǎn)上的 id 值,計算 id%10 的結(jié)果,記為 x;
  1)如果臨時表中沒有主鍵為 x 的行,就插入一個記錄 (x,1);
  2)如果表中有主鍵為 x 的行,就將 x 這一行的 c 值加 1;

第2 步如果發(fā)現(xiàn)內(nèi)存臨時表存儲的總字段長度到達(dá)參數(shù) tmp_table_size 設(shè)置的大小,那么就會將內(nèi)存臨時表升級為磁盤臨時表,然后重新開始遍歷計算。
3、遍歷完成后,再根據(jù)字段 m 做排序,得到結(jié)果集返回給客戶端。

最后的排序就是下圖虛線框中的操作,如果 sort_buffer 設(shè)置的大小不夠大,那么就會使用臨時表來輔助排序。

優(yōu)化

未優(yōu)化(也就是分組列沒有索引)的 group by 的總過程可以概括為:因?yàn)閿?shù)據(jù)是無序的,所以需要創(chuàng)建臨時表,然后一個一個判斷屬于哪個分組,最后再根據(jù)分組列進(jìn)行排序。所以,優(yōu)化可以有兩個思路:

去掉排序

在明確返回的數(shù)據(jù)不需要排序的情況下,可以禁止排序,也就是將上面的語句改成 select a,count(*) from t group by a order by null。

順序排列

如果記錄都按照排序字段排序,那么數(shù)據(jù)就變成了下面的結(jié)構(gòu):

這樣在實(shí)際獲取要返回的字段或計算聚合函數(shù)時,只需要按順序依次訪問,等到列值變成下一個就知道當(dāng)前組訪問結(jié)束,將之前統(tǒng)計的數(shù)據(jù)直接返回。這樣就避免了創(chuàng)建臨時表,同時排序也不需要使用 sort_buffer 進(jìn)行額外排序。這樣就極大地提高了執(zhí)行的效率。

實(shí)現(xiàn)

1、如果分組字段適合創(chuàng)建索引就直接為分組字段創(chuàng)建索引。

MySQL 5.7 版本支持了 generated column 機(jī)制,用來實(shí)現(xiàn)列數(shù)據(jù)的關(guān)聯(lián)更新。你可以用下面的方法創(chuàng)建一個列 z,然后在 z 列上創(chuàng)建一個索引(如果是 MySQL 5.6 及之前的版本,你也可以創(chuàng)建普通列和索引,來解決這個問題)

alter table t1 add column z int generated always as(id % 100), add index(z);

然后解析:

這時沒有用到臨時表和額外排序,所以性能提升。

2、如果分組字段不適合(使用率很低),那么可以使用 SQL_BIG_RESULT 來嘗試優(yōu)化。

在 group by 語句中加入 SQL_BIG_RESULT 這個提示(hint),就可以告訴優(yōu)化器:這個語句涉及的數(shù)據(jù)量很大,請直接用磁盤臨時表。MySQL 的優(yōu)化器一看,磁盤臨時表是 B+ 樹存儲,存儲效率不如數(shù)組來得高。所以,既然使用SQL_BIG_RESULT來說明數(shù)據(jù)量很大,那從磁盤空間考慮,還是直接用數(shù)組來存吧。所以在使用 SQL_BIG_RESULT 后優(yōu)化器會使用數(shù)組結(jié)構(gòu)的磁盤臨時表。

但是如果在未達(dá)到磁盤臨時表的使用條件是不會使用磁盤臨時表的,也就是在 sort_buffer 空間能夠存儲要返回和排序的總字段長度時,就使用數(shù)組結(jié)構(gòu)的 sort_buffer ,如果總字段超過 sort_buffer 大小,那么就再加上數(shù)組結(jié)構(gòu)的磁盤臨時表來幫助排序。

那么在 sort_buffer 空間足夠的情況下, sort_buffer 內(nèi)部就會對數(shù)據(jù)進(jìn)行排序,這樣也就起到了索引的作用,

還是以上面的例子來看,使用 SQL_BIG_RESULT

alter table t1 add column z int generated always as(id % 100), add index(z);

具體過程如下:

1、初始化 sort_buffer,確定放入一個整型字段,記為 m;
2、掃描表 t1 的索引 a,依次取出里面的 id 值, 將 id%10 的值存入 sort_buffer 中;
3、掃描完成后,對 sort_buffer 的字段 m 做排序(如果 sort_buffer 內(nèi)存不夠用,就會利用磁盤臨時文件輔助排序);
4、排序完成后,就得到了一個有序數(shù)組。

解析:

可以看到此時就沒有使用臨時表了,而是直接使用 sort_buffer 進(jìn)行排序,這樣就省去了使用臨時表帶來的性能消耗。

總結(jié)

1、如果對 group by 語句的結(jié)果沒有排序要求,要在語句后面加 order by null;那么一般情況就不需要使用臨時表了(上面兩個優(yōu)化都是在要求排序的前提下提出的優(yōu)化方式)
2、盡量讓 group by 過程用上表的索引,確認(rèn)方法是 explain 結(jié)果里沒有 Using temporary 和 Using filesort;
3、如果 group by 需要統(tǒng)計的數(shù)據(jù)量不大,盡量只使用內(nèi)存臨時表;也可以通過適當(dāng)調(diào)大 tmp_table_size 參數(shù),來避免用到磁盤臨時表;
4、如果數(shù)據(jù)量實(shí)在太大,使用 SQL_BIG_RESULT 這個提示,來告訴優(yōu)化器直接使用排序算法得到 group by 的結(jié)果。

以上就是詳解MySQL Group by 優(yōu)化的詳細(xì)內(nèi)容,更多關(guān)于MySQL Group by 優(yōu)化的資料請關(guān)注腳本之家其它相關(guān)文章!

相關(guān)文章

  • MySQL OOM 系列三 擺脫MySQL被Kill的厄運(yùn)

    MySQL OOM 系列三 擺脫MySQL被Kill的厄運(yùn)

    這篇文章主要介紹了MySQL OOM 系列三 擺脫MySQL被Kill的厄運(yùn) ,需要的朋友可以參考下
    2016-07-07
  • MySQL基礎(chǔ)入門之Case語句用法實(shí)例

    MySQL基礎(chǔ)入門之Case語句用法實(shí)例

    case語句是mysql中的一個條件語句,可以在字段中使用case語句進(jìn)行復(fù)雜的篩選以及構(gòu)造新的字段,下面這篇文章主要給大家介紹了關(guān)于MySQL基礎(chǔ)入門之Case語句用法的相關(guān)資料,需要的朋友可以參考下
    2022-08-08
  • MySQL中的?DQL?聚合函數(shù)詳解

    MySQL中的?DQL?聚合函數(shù)詳解

    SQL聚合函數(shù)是一組函數(shù),用于計算并返回數(shù)據(jù)集的單個值,這些函數(shù)通常用于在SELECT語句中匯總數(shù)據(jù),本文給大家介紹MySQL中的DQL聚合函數(shù),感興趣的朋友跟隨小編一起看看吧
    2023-07-07
  • 在MySQL中使用STRAIGHT_JOIN的教程

    在MySQL中使用STRAIGHT_JOIN的教程

    這篇文章主要介紹了在MySQL中使用STRAIGHT_JOIN的教程,包括使用STRAIGHT_JOIN進(jìn)行一些性能上的優(yōu)化的技巧,需要的朋友可以參考下
    2015-05-05
  • 為什么MySQL 使用timestamp可以無視時區(qū)問題.

    為什么MySQL 使用timestamp可以無視時區(qū)問題.

    這篇文章主要介紹了為什么MySQL timestamp可以無視時區(qū)問題,幫助大家更好的理解和使用MySQL,感興趣的朋友可以了解下
    2020-12-12
  • MySQL整型數(shù)據(jù)溢出的解決方法

    MySQL整型數(shù)據(jù)溢出的解決方法

    這篇文章主要介紹了MySQL整型數(shù)據(jù)溢出的解決方法,本文出現(xiàn)整型溢出的mysql版本是5.1,5.1下整型溢出不會報錯,而會變成負(fù)數(shù),需要的朋友可以參考下
    2014-07-07
  • Mysql DDL常見操作匯總

    Mysql DDL常見操作匯總

    這篇文章主要介紹了Mysql DDL常見操作匯總,文中通過示例代碼介紹的非常詳細(xì),對大家的學(xué)習(xí)或者工作具有一定的參考學(xué)習(xí)價值,需要的朋友們下面隨著小編來一起學(xué)習(xí)學(xué)習(xí)吧
    2020-09-09
  • mysql 5.7.11 winx64安裝配置教程

    mysql 5.7.11 winx64安裝配置教程

    這篇文章主要介紹了mysql 5.7.11 winx64安裝配置教程,介紹了MySQL5.7安裝及初始化,感興趣的小伙伴們可以參考一下
    2016-08-08
  • Navicat使用報2059錯誤的兩種解決方案

    Navicat使用報2059錯誤的兩種解決方案

    Navicat是一款流行的數(shù)據(jù)庫管理工具,而MySQL則是其中的一種數(shù)據(jù)庫軟件,下面這篇文章主要給大家介紹了關(guān)于Navicat使用報2059錯誤的兩種解決方案,需要的朋友可以參考下
    2023-11-11
  • MySQL 句柄數(shù)占用過多的解決方法

    MySQL 句柄數(shù)占用過多的解決方法

    本文主要介紹解決MySQL句柄占用過多的方法,簡單實(shí)用,需要的朋友可以參考下。
    2016-05-05

最新評論