MySQL 分表分庫(kù)怎么進(jìn)行數(shù)據(jù)切分
關(guān)系型數(shù)據(jù)庫(kù)本身比較容易成為系統(tǒng)瓶頸,單機(jī)存儲(chǔ)容量、連接數(shù)、處理能力都有限。當(dāng)單表的數(shù)據(jù)量達(dá)到1000W或100G以后,由于查詢維度較多,即使添加從庫(kù)、優(yōu)化索引,做很多操作時(shí)性能仍下降嚴(yán)重。此時(shí)就要考慮對(duì)其進(jìn)行切分了,切分的目的就在于減少數(shù)據(jù)庫(kù)的負(fù)擔(dān),縮短查詢時(shí)間。
數(shù)據(jù)庫(kù)分布式核心內(nèi)容無(wú)非就是數(shù)據(jù)切分(Sharding)以及切分后對(duì)數(shù)據(jù)的定位、整合。數(shù)據(jù)切分就是將數(shù)據(jù)分散存儲(chǔ)到多個(gè)數(shù)據(jù)庫(kù)中,使得單一數(shù)據(jù)庫(kù)中的數(shù)據(jù)量變小,通過(guò)擴(kuò)充主機(jī)的數(shù)量緩解單一數(shù)據(jù)庫(kù)的性能問(wèn)題,從而達(dá)到提升數(shù)據(jù)庫(kù)操作性能的目的。
數(shù)據(jù)切分根據(jù)其切分類型,可以分為兩種方式:垂直(縱向)切分和水平(橫向)切分。
1.垂直(縱向)切分
垂直切分常見(jiàn)有垂直分庫(kù)和垂直分表兩種。
1.1 垂直分庫(kù)
就是根據(jù)業(yè)務(wù)耦合性,將關(guān)聯(lián)度低的不同表存儲(chǔ)在不同的數(shù)據(jù)庫(kù)。做法與大系統(tǒng)拆分為多個(gè)小系統(tǒng)類似,按業(yè)務(wù)
分類進(jìn)行獨(dú)立劃分。與"微服務(wù)治理"的做法相似,每個(gè)微服務(wù)使用單獨(dú)的一個(gè)數(shù)據(jù)庫(kù)。如圖:
將不同模塊的數(shù)據(jù)表分庫(kù)存儲(chǔ)。模塊間不相互關(guān)聯(lián)查詢
如果有,就需要通過(guò)數(shù)據(jù)冗余或者應(yīng)層二次加工來(lái)解決。這種業(yè)務(wù)方法和數(shù)據(jù)結(jié)構(gòu)最清晰。但若不能杜絕跨庫(kù)關(guān)聯(lián)查詢,宣告此路不同
1.2 垂直分表
是基于數(shù)據(jù)庫(kù)中的"列"進(jìn)行,某個(gè)表字段較多,可以新建一張擴(kuò)展表,將不經(jīng)常用或字段長(zhǎng)度較大的字段拆分出去到擴(kuò)展表中。在字段很多的情況下(例如一個(gè)大表有100多個(gè)字段),通過(guò)"大表拆小表",更便于開(kāi)發(fā)與維護(hù),也能避免跨頁(yè)問(wèn)題,MySQL底層是通過(guò)數(shù)據(jù)頁(yè)存儲(chǔ)的,一條記錄占用空間過(guò)大會(huì)導(dǎo)致跨頁(yè),造成額外的性能開(kāi)銷。另外數(shù)據(jù)庫(kù)以行為單位將數(shù)據(jù)加載到內(nèi)存中,這樣表中字段長(zhǎng)度較短且訪問(wèn)頻率較高,內(nèi)存能加載更多的數(shù)據(jù),命中率更高,減少了磁盤IO,從而提升了數(shù)據(jù)庫(kù)性能。
垂直切分的優(yōu)點(diǎn):
- 解決業(yè)務(wù)系統(tǒng)層面的耦合,業(yè)務(wù)清晰
- 與微服務(wù)的治理類似,也能對(duì)不同業(yè)務(wù)的數(shù)據(jù)進(jìn)行分級(jí)管理、維護(hù)、監(jiān)控、擴(kuò)展等
- 高并發(fā)場(chǎng)景下,垂直切分一定程度的提升IO、數(shù)據(jù)庫(kù)連接數(shù)、單機(jī)硬件資源的瓶頸
缺點(diǎn):
- 部分表無(wú)法join,只能通過(guò)接口聚合方式解決,提升了開(kāi)發(fā)的復(fù)雜度
- 分布式事務(wù)處理復(fù)雜
- 依然存在單表數(shù)據(jù)量過(guò)大的問(wèn)題(需要水平切分)
2. 水平(橫向)切分
當(dāng)一個(gè)應(yīng)用難以再細(xì)粒度的垂直切分,或切分后數(shù)據(jù)量行數(shù)巨大,存在單庫(kù)讀寫、存儲(chǔ)性能瓶頸,這時(shí)候就需要進(jìn)行水平切分了。
水平切分分為庫(kù)內(nèi)分表和分庫(kù)分表,是根據(jù)表內(nèi)數(shù)據(jù)內(nèi)在的邏輯關(guān)系,將同一個(gè)表按不同的條件分散到多個(gè)數(shù)據(jù)庫(kù)或多個(gè)表中,每個(gè)表中只包含一部分?jǐn)?shù)據(jù),從而使得單個(gè)表的數(shù)據(jù)量變小,達(dá)到分布式的效果。如圖所示:
相對(duì)縱向切分這一將表分類的做法,此法是按表內(nèi)每個(gè)字段的某個(gè)規(guī)則來(lái)將數(shù)據(jù)分散存儲(chǔ)于不同的數(shù)據(jù)庫(kù)(或不同的表),也就是按照數(shù)行來(lái)進(jìn)行切分?jǐn)?shù)據(jù)。
庫(kù)內(nèi)分表只解決了單一表數(shù)據(jù)量過(guò)大的問(wèn)題,但沒(méi)有將表分布到不同機(jī)器的庫(kù)上,因此對(duì)于減輕MySQL數(shù)據(jù)庫(kù)的壓力來(lái)說(shuō),幫助不是很大,大家還是競(jìng)爭(zhēng)同一個(gè)物理機(jī)的CPU、內(nèi)存、網(wǎng)絡(luò)IO,最好通過(guò)分庫(kù)分表來(lái)解決。
水平切分的優(yōu)點(diǎn):
- 不存在單庫(kù)數(shù)據(jù)量過(guò)大、高并發(fā)的性能瓶頸,提升系統(tǒng)穩(wěn)定性和負(fù)載能力
- 應(yīng)用端改造較小,不需要拆分業(yè)務(wù)模塊
缺點(diǎn):
- 跨分片的事務(wù)一致性難以保證
- 跨庫(kù)的join關(guān)聯(lián)查詢性能較差
- 數(shù)據(jù)多次擴(kuò)展難度和維護(hù)量極大
水平切分后同一張表會(huì)出現(xiàn)在多個(gè)數(shù)據(jù)庫(kù)/表中,每個(gè)庫(kù)/表的內(nèi)容不同。幾種典型的數(shù)據(jù)分片規(guī)則為:
2.1 根據(jù)數(shù)值范圍
按照時(shí)間區(qū)間或ID區(qū)間來(lái)切分。例如:按日期將不同月甚至是日的數(shù)據(jù)分散到不同的庫(kù)中;將userId為1~9999的記錄分到第一個(gè)庫(kù),10000~20000的分到第二個(gè)庫(kù),以此類推。某種意義上,某些系統(tǒng)中使用的"冷熱數(shù)據(jù)分離",將一些使用較少的歷史數(shù)據(jù)遷移到其他庫(kù)中,業(yè)務(wù)功能上只提供熱點(diǎn)數(shù)據(jù)的查詢,也是類似的實(shí)踐。
這樣的優(yōu)點(diǎn)在于:
- 單表大小可控
- 天然便于水平擴(kuò)展,后期如果想對(duì)整個(gè)分片集群擴(kuò)容時(shí),只需要添加節(jié)點(diǎn)即可,無(wú)需對(duì)其他分片的數(shù)據(jù)進(jìn)行遷移
- 使用分片字段進(jìn)行范圍查找時(shí),連續(xù)分片可快速定位分片進(jìn)行快速查詢,有效避免跨分片查詢的問(wèn)題。
缺點(diǎn):
- 熱點(diǎn)數(shù)據(jù)成為性能瓶頸。連續(xù)分片可能存在數(shù)據(jù)熱點(diǎn),例如按時(shí)間字段分片,有些分片存儲(chǔ)最近時(shí)間段內(nèi)的數(shù)據(jù),可能會(huì)被頻繁的讀寫,而有些分片存儲(chǔ)的歷史數(shù)據(jù),則很少被查詢
2.2 根據(jù)數(shù)值取模
一般采用hash取模mod的切分方式,例如:將 Customer 表根據(jù) cusno 字段切分到4個(gè)庫(kù)中,余數(shù)為0的放到第一個(gè)庫(kù),余數(shù)為1的放到第二個(gè)庫(kù),以此類推。這樣同一個(gè)用戶的數(shù)據(jù)會(huì)分散到同一個(gè)庫(kù)中,如果查詢條件帶有cusno字段,則可明確定位到相應(yīng)庫(kù)去查詢。
優(yōu)點(diǎn):
- 數(shù)據(jù)分片相對(duì)比較均勻,不容易出現(xiàn)熱點(diǎn)和并發(fā)訪問(wèn)的瓶頸
缺點(diǎn):
- 后期分片集群擴(kuò)容時(shí),需要遷移舊的數(shù)據(jù)(使用一致性hash算法能較好的避免這個(gè)問(wèn)題)
- 容易面臨跨分片查詢的復(fù)雜問(wèn)題。比如上例中,如果頻繁用到的查詢條件中不帶cusno時(shí),將會(huì)導(dǎo)致無(wú)法定位數(shù)據(jù)庫(kù),從而需要同時(shí)向4個(gè)庫(kù)發(fā)起查詢,再在內(nèi)存中合并數(shù)據(jù),取最小集返回給應(yīng)用,分庫(kù)反而成為拖累。
以上就是MySQL 分表分庫(kù)怎么進(jìn)行數(shù)據(jù)切分的詳細(xì)內(nèi)容,更多關(guān)于MySQL 分表分庫(kù)進(jìn)行數(shù)據(jù)切分的資料請(qǐng)關(guān)注腳本之家其它相關(guān)文章!
相關(guān)文章
mysql主從同步原理及應(yīng)用場(chǎng)景示例詳解
這篇文章主要為大家介紹了mysql主從同步原理及應(yīng)用場(chǎng)景示例詳解,有需要的朋友可以借鑒參考下,希望能夠有所幫助,祝大家多多進(jìn)步,早日升職加薪2022-08-08Mysql數(shù)據(jù)表中的蠕蟲復(fù)制使用方法
在本文中我們給大家分享了關(guān)于怎么使用Mysql數(shù)據(jù)表中的蠕蟲復(fù)制的相關(guān)知識(shí)點(diǎn),有興趣的朋友們學(xué)習(xí)下。2019-02-02MySQL全文索引實(shí)現(xiàn)簡(jiǎn)單版搜索引擎實(shí)例代碼
這篇文章主要給大家介紹了關(guān)于MySQL全文索引實(shí)現(xiàn)簡(jiǎn)單版搜索引擎的相關(guān)資料,文中通過(guò)示例代碼介紹的非常詳細(xì),對(duì)大家學(xué)習(xí)或者使用MySQL具有一定的參考學(xué)習(xí)價(jià)值,需要的朋友們下面來(lái)一起學(xué)習(xí)學(xué)習(xí)吧2019-07-07MySQL復(fù)制的概述、安裝、故障、技巧、工具(火丁分享)
首先主服務(wù)器把數(shù)據(jù)變化記錄到主日志,然后從服務(wù)器通過(guò)I/O線程讀取主服務(wù)器上的主日志,并且把它寫入到從服務(wù)器的中繼日志中,接著SQL線程讀取中繼日志,并且在從服務(wù)器上重放,從而實(shí)現(xiàn)MySQL復(fù)制。2011-04-04mysql 5.7.13 winx64安裝配置方法圖文教程(win10)
這篇文章主要為大家分享了mysql 5.7.13 winx64安裝配置方法圖文教程,具有一定的參考價(jià)值,感興趣的小伙伴們可以參考一下2017-01-01利用MySQL空間函數(shù)實(shí)現(xiàn)位置打卡的完整步驟
這篇文章主要給大家介紹了關(guān)于如何利用MySQL空間函數(shù)實(shí)現(xiàn)位置打卡的完整步驟,文中通過(guò)示例代碼介紹的非常詳細(xì),對(duì)大家學(xué)習(xí)或者使用MySQL具有一定的參考學(xué)習(xí)價(jià)值,需要的朋友們下面來(lái)一起學(xué)習(xí)學(xué)習(xí)吧2020-08-08Mysql聯(lián)合索引的原理與實(shí)現(xiàn)
聯(lián)合索引是一種將多個(gè)列組合成一個(gè)索引的技術(shù),以提高基于這些列進(jìn)行查詢的性能,本文主要介紹了Mysql聯(lián)合索引的原理與實(shí)現(xiàn),具有一定的參考價(jià)值,感興趣的可以了解一下2024-08-08mysqldump進(jìn)行數(shù)據(jù)備份詳解
這篇文章主要介紹了mysqldump進(jìn)行數(shù)據(jù)備份詳解,文章圍繞主題展開(kāi)詳細(xì)的內(nèi)容介紹,具有一定的參考價(jià)值,需要的小伙伴可以慘一下2022-07-07