快捷導(dǎo)航

MYSQL數(shù)據(jù)庫基礎(chǔ)之Join操作原理

更新時間：2021年07月05日 11:14:38 作者：某某小孩

這篇文章主要給大家介紹了關(guān)于MYSQL數(shù)據(jù)庫基礎(chǔ)之Join操作原理的相關(guān)資料,連接(join)查詢是將兩個查詢的結(jié)果以“橫向?qū)印钡姆绞胶喜⑵饋淼慕Y(jié)果,需要的朋友可以參考下

Join使用的是Nested-Loop Join算法，Nested-Loop Join有三種

select * from t1 join t2 on t1.a = t2.a;
-- a 100條數(shù)據(jù), b 1000條數(shù)據(jù)

會遍歷t1全表，t1作為驅(qū)動表，t1中的每一條數(shù)據(jù)都會到t2中做一次全表查詢，該過程會比較100*1000次。

每次在t2中做全表查詢時，全表掃描可就不保證在內(nèi)存里了，Buffer Pool會淘汰，有可能在磁盤。

會遍歷t1全表，將t1數(shù)據(jù)加載到j(luò)oin_buffer中，再遍歷t2全表，讓t2的每條數(shù)據(jù)去匹配join_buffer中t1緩存的數(shù)據(jù)。

t1全表掃描 = 100次

t2全表掃描 = 1000次

查詢次數(shù) = 1100次

join_buffer中比較 = 100 * 1000次

比較的次數(shù)和Simple Nested-Loop Join是一樣的，但是比較的過程會比Simple Nested-Loop Join快很多，性能更好。

join_buffer是有大小的，如果t1查出來的數(shù)據(jù)是大于join_buffer大小的，則會先加載部分t1中的數(shù)據(jù)，比較完t2以后，清空join_buffer，再加載t1中剩余數(shù)據(jù)，加載不完全，再重復(fù)該操作。

t1全表掃描次數(shù)和join_buffer中比較1次數(shù)不變，但是t2的掃描次數(shù)會根據(jù)分段次數(shù)做一個乘法。

假設(shè)，驅(qū)動表的數(shù)據(jù)行數(shù)是 N，需要分 K 段才能完成算法流程，被驅(qū)動表的數(shù)據(jù)行數(shù)是 M。

K = λ * N

掃描被驅(qū)動表次數(shù) = M * λ * N

λ是和join_buffer的大小有關(guān)的，join_buffer大小足夠的情況下，大表驅(qū)動和小表驅(qū)動的時間是一樣的。

需要分段的情況下，分段次數(shù)越少，被驅(qū)動表掃描的次數(shù)也會越少，所以應(yīng)該采用小表驅(qū)動。

還是以上面的sql為例，如果a字段是有索引的。

t1表會掃描全表，t1表中每條數(shù)據(jù)會去t2表中做索引查詢，查到id后再進行回表查詢（如果連接字段是t2表的主鍵，回表操作將省略）。

t1掃描全表 = 100次

t2索引查詢 = log1000次

t2回表查詢 = log1000次

假設(shè)，驅(qū)動表的數(shù)據(jù)行數(shù)是 N，被驅(qū)動表的數(shù)據(jù)行數(shù)是 M。

總查詢次數(shù) = N + N * 2logM

由上可見，驅(qū)動表數(shù)據(jù)越大，查詢的次數(shù)會越多，所以應(yīng)該使用小表作為驅(qū)動表。

文章參考《MySQL實戰(zhàn)45講--第34講》

到此這篇關(guān)于MYSQL數(shù)據(jù)庫基礎(chǔ)之Join操作原理的文章就介紹到這了,更多相關(guān)MYSQL Join原理內(nèi)容請搜索腳本之家以前的文章或繼續(xù)瀏覽下面的相關(guān)文章希望大家以后多多支持腳本之家！

您可能感興趣的文章:

欧美bbbwbbbw肥妇,免费乱码人妻系列日韩,一级黄片