MySQL是如何處理排序的(最新推薦)
前言
在MySQL的查詢中常常會用到order by
和group by
這兩個關鍵字
它們的相同點是都會對字段進行排序,那查詢語句中的排序是如何實現(xiàn)的呢?
當使用的查詢語句需要進行排序時有兩種處理情況:
- 當前記錄本來就是有序的,不需要進行排序
- 當前記錄未保持順序,需要排序
使用索引保證有序
對于第一種情況,常常是使用二級索引中索引列的有序來保證結果集有序,從而不需要進行排序
對于表a,為a2建立二級索引,那么在二級索引上a2就是有序的
CREATE TABLE `a` ( `a1` int(11) NOT NULL AUTO_INCREMENT, `a2` varchar(255) CHARACTER SET utf8mb4 DEFAULT NULL, `a3` varchar(255) DEFAULT NULL, PRIMARY KEY (`a1`), KEY `idx_a2` (`a2`) ) ENGINE=InnoDB AUTO_INCREMENT=76 DEFAULT CHARSET=utf8;
select * from a order by a.a2 limit 10
當優(yōu)化器選擇使用a2索引時,a2列的記錄本身就是有序的,因此不需要再使用其他開銷進行排序
當然,優(yōu)化器也有可能不使用a2索引(當優(yōu)化器認為使用a2回表開銷太大時會使用全表掃描)
當優(yōu)化器使用的索引上a2無序時,則會通過其他手段對結果進行排序
filesort
當執(zhí)行計劃的Extra附加信息中出現(xiàn)Using filesort
時,會使用sort_buffer對結果進行排序
sort_buffer是一塊用于排序的內(nèi)存,sort_buffer可能存放查詢需要的所有字段,也可能只存放需要排序的字段和主鍵
show variables like 'max_length_for_sort_data'
當查詢需要的字段長度小于max_length_for_sort_data
時,則會將查詢需要的所有字段放入sort_buffer中,然后對需要排序的列進行排序,最后返回結果
當查詢需要的字段長度大于max_length_for_sort_data
時,只會將需要排序的字段和主鍵值放入sort_buffer中,等到排序后再去查詢聚簇索引獲取需要查詢的列(相當于又多了一次回表)
在sort_buffer中進行排序時,如果內(nèi)存足夠則會在內(nèi)存中進行排序,如果內(nèi)存不夠則會使用磁盤的臨時文件來輔助排序
開啟optimizer_trace
可以查看是否使用臨時文件輔助排序
#開啟優(yōu)化器追蹤 SET optimizer_trace='enabled=on'; ? #sql語句 select * from student order by student_name limit 10000; ? #查看優(yōu)化器追蹤的信息 SELECT * FROM `information_schema`.`OPTIMIZER_TRACE`\G;
排序使用的算法是歸并算法,先分割成多個小文件排序再進行合并
其中number_of_tmp_files
為使用到的臨時文件數(shù)量,sort_buffer_size
為sort_buffer大小
因此當使用order by、group by等需要排序的關鍵字時,最好建立合適的索引
如果數(shù)據(jù)量小可以在sort buffer中排序,如果數(shù)據(jù)量太大還需要與磁盤交互
總結
當查詢語句需要排序時會分為不用排序和需要排序兩種情況
當使用的索引有序時則不用再進行排序,通過索引來保證有序
當使用的索引無序時則會使用sort_buffer進行排序,當查詢字段的長度未超過限制時,sort_buffer中每條記錄會存儲需要查詢的列
如果超過限制,則sort_buffer只會存儲需要排序的列和主鍵值,排序后再通過主鍵值進行回表獲取需要查詢的列
當數(shù)據(jù)量太大不夠在內(nèi)存中排序完,會使用磁盤頁輔助排序,使用歸并算法將排序數(shù)據(jù)分散在多個頁再合并
可以通過追蹤優(yōu)化器 optimizer_trace 分析內(nèi)容查看輔助頁的數(shù)量等信息
為需要排序的列建立合適的索引,避免使用磁盤頁輔助排序
當無法使用索引時可以調(diào)整sort buffer 或 max_length_for_sort_data(謹慎)
到此這篇關于聊聊MySQL是如何處理排序的的文章就介紹到這了,更多相關mysql排序內(nèi)容請搜索腳本之家以前的文章或繼續(xù)瀏覽下面的相關文章希望大家以后多多支持腳本之家!
相關文章
MySql使用skip-name-resolve解決外網(wǎng)鏈接客戶端過慢問題
在騰訊云上面搭建的mysql使用開發(fā)的電腦上navicat進行訪問時總是特別的慢,原來是Mysql會對請求的地址進行域名解析,開發(fā)的電腦并沒有域名,所以會導致特別的慢,下面通過本文給大家分享MySql使用skip-name-resolve解決外網(wǎng)鏈接客戶端過慢問題2017-07-07MySQL窗口函數(shù) over(partition by)的用法
本文主要介紹了MySQL窗口函數(shù) over(partition by)的用法, partition by相比較于group by,能夠在保留全部數(shù)據(jù)的基礎上,只對其中某些字段做分組排序,下面就來介紹一下具體用法,感興趣的可以了解一下2024-02-02MySQL數(shù)據(jù)庫中使用REPLACE函數(shù)示例及實際應用
本文詳細介紹了MySQL中的REPLACE函數(shù),包括其基本語法、用法和實際應用場景,REPLACE函數(shù)主要用于替換字符串中的某些子字符串,對大小寫敏感,文章還通過多個示例展示了REPLACE函數(shù)的實際應用,需要的朋友可以參考下2024-10-10Java實現(xiàn)獲得MySQL數(shù)據(jù)庫中所有表的記錄總數(shù)可行方法
可以通過SELECT COUNT(*) FROM table_name查詢某個表中有多少條記錄。本文給出兩種可行的Java程序查詢所有別的記錄方法,感興趣朋友可以了解下2013-06-06