MySql更新優(yōu)化策略
模擬場(chǎng)景一:
給數(shù)據(jù)庫(kù)中的一張表的結(jié)構(gòu)調(diào)整,添加幾個(gè)字段,后面對(duì)之前的數(shù)據(jù)進(jìn)行刷新,刷新的內(nèi)容是對(duì)其中的一個(gè)已有字段url進(jìn)行匹配,然后更新新加的字段type和typeid。
后來就寫了個(gè)shell腳本來刷數(shù)據(jù),結(jié)果運(yùn)行shell腳本后我就懵了,怎么這么慢~~~
情景再現(xiàn)
CREATE TABLE `fuckSpeed` (
`uin` bigint(20) unsigned NOT NULL DEFAULT 0,
`id` int(11) unsigned NOT NULL DEFAULT 0,
`url` varchar(255) NOT NULL DEFAULT '',
`type` int(11) unsigned NOT NULL DEFAULT 0,
`typeid` varchar(64) NOT NULL DEFAULT '',
......
KEY `uin_id` (`uin`,`id`)
) ENGINE=InnoDB DEFAULT CHARSET=utf8;
表結(jié)構(gòu)大概是上面這樣的(省略了好多字段),表中只有一個(gè)聯(lián)合索引uin_id,而我在更新的時(shí)候是下面的思路:
首先根據(jù)一個(gè)id范圍獲取到一定數(shù)量的數(shù)據(jù)
select id,url from funkSpeed where id>=101 and id<=200;
遍歷所有的數(shù)據(jù),對(duì)每一條數(shù)據(jù)進(jìn)行更新
#首先對(duì)數(shù)據(jù)進(jìn)行處理,匹配獲取type和typeid
update fuckSpeed set type=[type],typeid=[typeid] where id=[id]
按照上面的思路搞了之后,發(fā)現(xiàn)更新特別的慢,平均每秒鐘3~5個(gè)左右,我也是醉了,我看看要更新的數(shù)據(jù),總共有32w+條,這樣更新下來大概需要24h+,也就是1天還要多,額~~哭了,想想肯定是哪里出問題了。
發(fā)現(xiàn)問題
首先我想到的是是不是因?yàn)橹挥幸粋€(gè)進(jìn)程在更新,導(dǎo)致很慢,我啟動(dòng)了5個(gè)進(jìn)程,將id分段了,就像下面這樣
./update_url.sh 0 10000 &
./update_url.sh 10000 20001 &
./update_url.sh 20001 30001 &
./update_url.sh 30002 40002 &
./update_url.sh 40003 50003 &
運(yùn)行之后發(fā)現(xiàn)還是那樣,速度沒有提升多少,還是每秒鐘更新3~5個(gè)左右,想想也是啊,時(shí)間不可能花費(fèi)在插入數(shù)據(jù)之前的那些步驟(匹配、組裝sql語句、。。。),應(yīng)該是插入的時(shí)候有問題
再來看看我的sql語句
select id,url from funkSpeed where id>=101 and id<=200;,
這里,試著在命令行執(zhí)行了下,結(jié)果如下
mysql> select id,url from funkSpeed where id>=0 and id<=200;
Empty set (0.18 sec)
竟然花了0.18秒,這個(gè)時(shí)候我猜恍然大悟,聯(lián)合索引我沒有使用到,聯(lián)合索引生效的條件是——必須要有左邊的字段,用explain驗(yàn)證下,果然是這樣:
mysql> explain id,url from funkSpeed where id>=0 and id<=200;
+-------------+------+---------------+------+---------+------+--------+-------------+
| table | type | possible_keys | key | key_len | ref | rows | Extra |
+-------------+------+---------------+------+---------+------+--------+-------------+
| funkSpeed | ALL | NULL | NULL | NULL | NULL | 324746 | Using where |
+-------------+------+---------------+------+---------+------+--------+-------------+
1 row in set (0.00 sec)
然后使用聯(lián)合索引:
mysql> select uin,id from funkSpeed where uin=10023 and id=162;
+------------+----------+
| uin | id |
+------------+----------+
| 10023 | 162 |
+------------+----------+
1 row in set (0.00 sec)
mysql> explain select uin,id from funkSpeed where uin=10023 and id=162;
+-------------+------+---------------+----------+---------+-------------+------+-------------+
| table | type | possible_keys | key | key_len | ref | rows | Extra |
+-------------+------+---------------+----------+---------+-------------+------+-------------+
| funkSpeed | ref | uin_id | uin_id | 12 | const,const | 4 | Using index |
+-------------+------+---------------+----------+---------+-------------+------+-------------+
1 row in set (0.00 sec)
可以看到幾乎是秒查,這個(gè)時(shí)候基本可以斷定問題是出現(xiàn)在索引這個(gè)地方了
我select的時(shí)候次數(shù)比較少,每?jī)蓚€(gè)select之間id相差10000,所以這里可以忽略掉,而且這里沒辦法優(yōu)化,除非在id上面添加索引。
問題發(fā)生在
update fuckSpeed set type=[type],typeid=[typeid] where id=[id]
這里在更新的時(shí)候也是會(huì)用到查詢的,我的mysql版本是5.5,不能explain update,不然肯定可以驗(yàn)證我所說的,這里要更新32w+條數(shù)據(jù),每條數(shù)據(jù)都會(huì)去更新,每條數(shù)據(jù)0.2s左右,這太嚇人了~~
解決問題
問題找到了,解決起來就容易多了~~
select的時(shí)候加了一個(gè)字段uin,改為下面這樣
select uin,id,url from funkSpeed where id>=101 and id<=200;
然后更新的時(shí)候使用
update fuckSpeed set type=[type],typeid=[typeid] where uin=[uin] id=[id]
這樣一來索引就是用上了。
三下五除二改好了代碼,試著啟動(dòng)了一個(gè)進(jìn)程,看看效果如何,果然,效果提升的不是一點(diǎn)點(diǎn),平均30+次/s,這樣大概3個(gè)小時(shí)左右就可以完成所有的更新了。
模擬場(chǎng)景二:
需求6個(gè)表 pid字段 寫到對(duì)應(yīng)的brand_id字段
問題sql背景:項(xiàng)目有6個(gè)表的要根據(jù)pid字段要寫入對(duì)應(yīng)的brand_id字段。但是這個(gè)其中有兩個(gè)表是千萬級(jí)別的。我的worker運(yùn)行之后,線上的mysql主從同步立刻延遲了!運(yùn)行了一個(gè)多小時(shí)之后,居然延遲到了40分鐘,而且只更新了十幾萬行數(shù)據(jù)。問題sql如下:
<!-- 根據(jù)商品id更新品牌id -->
<update id="updateBrandIdByPid" parameterClass="com.jd.chat.worker.domain.param.UpdateBrandIdParam">
UPDATE $tableName$
SET brand_id = #newBrandId#
WHERE pid = #pid#
AND brand_id = 0
</update>
項(xiàng)目組的mysql專家?guī)臀曳治隽讼?,因?yàn)閜id字段沒有索引,mysql引擎要逐行掃描出與傳入的pid值相等的列,然后更新數(shù)據(jù),也就是要掃描完1000W+行磁盤數(shù)據(jù)才能執(zhí)行完這個(gè)sql。更嚴(yán)重的是,這個(gè)千萬級(jí)的表里面有多少個(gè)不同的pid,我就要執(zhí)行多少個(gè)這樣的sql。
同事給我的建議的根據(jù)id字段進(jìn)行sql代碼層次的縱向分表。每次更新1000行的數(shù)據(jù),這樣mysql引擎就不用每次在掃全表了,數(shù)據(jù)庫(kù)壓力是之前的萬分之一。而且id作為主鍵,是有索引的有索引,有索引能大大優(yōu)化查詢性能,優(yōu)化后的sql如下:
<!-- 根據(jù)商品id更新品牌id -->
<update id="updateBrandIdByPid" parameterClass="com.jd.chat.worker.domain.param.UpdateBrandIdParam">
UPDATE $tableName$
SET brand_id = #newBrandId#
WHERE pid = #pid#
AND brand_id = 0
AND id BETWEEN #startNum# AND #endNum#
</update>
僅僅用了id限區(qū)間的語句,將一個(gè)千萬級(jí)的大表代碼層次上進(jìn)行縱向切割。重新上線worker后,mysql主從沒有任何延遲!而且經(jīng)過監(jiān)視,短短10分鐘就更新了十幾萬數(shù)據(jù),效率是之前的6倍!更重要的是數(shù)據(jù)庫(kù)負(fù)載均衡,應(yīng)用健康運(yùn)行。
以上通過兩個(gè)問題模擬場(chǎng)景再現(xiàn)分析MySql更新優(yōu)化策略,希望對(duì)大家在數(shù)據(jù)庫(kù)方面有所幫助。
相關(guān)文章
教你輕松恢復(fù)/修復(fù)SQL Server的MDF文件
下面將主要討論一下后者的備份與恢復(fù)。本文假定您 能熟練使用SQL Server Enterprise Manager(SQL Server企業(yè)管理器)和SQL Server Quwey Analyser(SQL Server查詢分析器)2013-11-11Windows Server2008 R2 MVC 環(huán)境安裝配置教程
這篇文章主要為大家詳細(xì)介紹了Windows Server2008 R2 MVC 環(huán)境安裝配置教程,感興趣的小伙伴們可以參考一下2016-09-09sql server服務(wù)無法啟動(dòng)的解決方案
sql server軟件是一款關(guān)系型數(shù)據(jù)庫(kù)管理系統(tǒng),具有使用方便可伸縮性好與相關(guān)軟件集成程度高等優(yōu)點(diǎn),我們?cè)跀?shù)據(jù)編程操作時(shí)經(jīng)常會(huì)使用這款編程軟件,在編程時(shí)系統(tǒng)有時(shí)會(huì)提示sql server服務(wù)無法啟動(dòng),那么大家該如何正常啟動(dòng)呢,下面就由小編來給大家介紹一下如何解決2023-11-11實(shí)現(xiàn)SQL分頁的存儲(chǔ)過程代碼
本文主要介紹了分頁的存儲(chǔ)過程所實(shí)現(xiàn)代碼,使用存儲(chǔ)過程可以提高效率與節(jié)約時(shí)間,需要的朋友可以參考下2015-08-08SQL Server 總結(jié)復(fù)習(xí) (二)
SQL Server 總結(jié)復(fù)習(xí),學(xué)習(xí)sqlserver的朋友可以參考下2012-08-08sqlserver 自動(dòng)備份所有數(shù)據(jù)庫(kù)的SQL
可自動(dòng)備份除系統(tǒng)數(shù)據(jù)庫(kù)外的所有數(shù)據(jù)庫(kù)。備份文件的周期保存周期可以更改。2010-03-03SQL Server 監(jiān)控磁盤IO錯(cuò)誤,msdb.dbo.suspect_pages
suspect_pages 表位于 msdb 數(shù)據(jù)庫(kù)中,是在 SQL Server 2005 中引入的。用于維護(hù)有關(guān)可疑頁的信息的 suspect_pages2014-10-10