MySQL性能優(yōu)化 出題業(yè)務(wù)SQL優(yōu)化
先簡單介紹一下項(xiàng)目背景。這是一個在線考試練習(xí)平臺,數(shù)據(jù)庫使用MySQL,表結(jié)構(gòu)如圖所示:
Question是存儲題目的表,數(shù)據(jù)量在3萬左右。AnswerResult表是存儲用戶作答結(jié)果的表,分表之后單表記錄大概在300萬-400萬。
需求:根據(jù)用戶的作答結(jié)果出練習(xí)卷,題目的優(yōu)先級為:未做過的題目>只做錯的題目>做錯又做對的題目>只做對的題目。
在“做錯又做對的題目”中,會按錯誤次數(shù)和正確次數(shù)的比例進(jìn)行權(quán)重計(jì)算,比如:A、做錯10次,做對100次;B、做錯10次,做對20次。這時B被選中出給用戶練習(xí)的概率就大。
備注:AnswerResult表中不存在QuestionId的記錄,則代表該題沒有做過。
之前使用的方法:
SELECT Question.題目標(biāo)識,IFNULL((0-正確次數(shù))/(正確次數(shù)+錯誤次數(shù)),1) AS 權(quán)重 FROM Question
LEFT JOIN AnswerResult ON AnswerResult.題目標(biāo)識 = Question.題目標(biāo)識
WHERE 用戶標(biāo)識={UserId}
說明:IFNULL((0-正確次數(shù))/(正確次數(shù)+錯誤次數(shù)),1)這個函數(shù)式分2部分,
公式:(0-正確次數(shù))/(正確次數(shù)+錯誤次數(shù))得到題目的權(quán)重,這個區(qū)間為[0,-1],0表示只做錯的題目,-1表示只做對的題目。IFNULL(value,1)則將未做過的題目權(quán)重設(shè)置為1,根據(jù)這個權(quán)重進(jìn)行排序列出題目。
由于AnswerResult表是多達(dá)300、400百萬的表,所以通過LEFT JOIN進(jìn)行左連接時,迪卡爾乘積過大,又加上AnswerResult是頻繁讀寫的表,很容易導(dǎo)致這條SQL變成慢查詢。
性能問題被提上日程后,這條SQL語句就變成的優(yōu)化點(diǎn)。
1、IFNULL()這個函數(shù)計(jì)算可以調(diào)整成冗余字段。
2、LEFT JOIN的迪卡爾乘積太大,可以調(diào)整為冗余或者使用INNER JOIN以提高查詢速度。
3、根據(jù)需求,其實(shí)可以調(diào)整出題策略,不同的情況執(zhí)行不同的SQL,而不需要在同一條SQL中實(shí)現(xiàn)。
解決方案針對以上三個點(diǎn)進(jìn)行調(diào)整。雖然Question表有3萬條數(shù)據(jù),但是出題的場景其實(shí)是針對知識點(diǎn)出題,單個知識點(diǎn)題目最多也只有1000題左右,所以獲取未做過的題目時,完全可以使用NOT IN走索引來完成。SQL語句如:
A:SELECT 題目標(biāo)識 FROM Question WHERE 知識點(diǎn)={KnowledgePointCode} AND 題目標(biāo)識 NOT IN (
SELECT 題目標(biāo)識 FROM AnswerResult INNER JOIN Question AND Question.知識點(diǎn)={KnowledgePointCode}
WHERE AnswerResult.用戶標(biāo)識 = {UserId}
)
針對只做錯的題目出題練習(xí)就簡單了(正確次數(shù) = 0代表只做錯),SQL如:
B:SELECT 題目標(biāo)識 FROM AnswerResult INNER JOIN Question AND Question.知識點(diǎn)={KnowledgePointCode}
WHERE AnswerResult.用戶標(biāo)識 = {UserId} AND 正確次數(shù) = 0 ORDER BY 錯誤次數(shù) DESC
若要對做錯、做對或者只做對的題目進(jìn)行出題,SQL就是這樣的(已經(jīng)對權(quán)重進(jìn)行冗余=IFNULL((0-正確次數(shù))/(正確次數(shù)+錯誤次數(shù)),1)):
C:SELECT 題目標(biāo)識 FROM AnswerResult INNER JOIN Question AND Question.知識點(diǎn)={KnowledgePointCode}
WHERE AnswerResult.用戶標(biāo)識 = {UserId} AND 正確次數(shù) > 0 ORDER BY 權(quán)重 DESC
不足:SQL語句A的查詢速度依然是較慢的,雖然有縮小NOT IN的結(jié)果集,但這里還是有優(yōu)化點(diǎn)。園子里的朋友們能不能給點(diǎn)建議?
有人說JOIN是SQL的性能殺手,我覺得主要還是怎么去使用JOIN,MySQL的索引優(yōu)化相當(dāng)重要,如果JOIN成為性能瓶頸,可以EXPLAIN看看是不是索引沒有建好,并且盡量讓迪卡爾乘積盡量小。使用冗余數(shù)據(jù)避免JOIN,當(dāng)可能變化的冗余數(shù)據(jù)被分表之后,更新這些冗余數(shù)據(jù)就是一件非常頭痛的事了。海量數(shù)據(jù)高并發(fā),確實(shí)是一件挺頭痛的事。
望園子里有這方面經(jīng)驗(yàn)的朋友不吝賜教。謝謝。
- 101個MySQL優(yōu)化技巧和提示
- MySQL優(yōu)化必須調(diào)整的10項(xiàng)配置
- mysql優(yōu)化取隨機(jī)數(shù)據(jù)慢的方法
- 跟著hsp一步步學(xué)mysql優(yōu)化的方法
- 有關(guān)mysql優(yōu)化的一些東東整理
- LAMP服務(wù)器性能優(yōu)化技巧之Mysql優(yōu)化
- MySQL優(yōu)化配置文件my.ini(discuz論壇)
- mysql優(yōu)化配置參數(shù)
- 非常不錯的MySQL優(yōu)化的8條經(jīng)驗(yàn)
- MySQL優(yōu)化全攻略-相關(guān)數(shù)據(jù)庫命令
- mysql數(shù)據(jù)庫sql優(yōu)化原則(經(jīng)驗(yàn)總結(jié))
相關(guān)文章
MySQL數(shù)據(jù)庫設(shè)計(jì)概念及多表查詢和事物操作
數(shù)據(jù)庫設(shè)計(jì)就是根據(jù)業(yè)務(wù)系統(tǒng)具體需求,結(jié)合我們所選用的DBMS,為這個業(yè)務(wù)系統(tǒng)構(gòu)造出最優(yōu)的數(shù)據(jù)存儲模型,本文給大家介紹MySQL數(shù)據(jù)庫設(shè)計(jì)概念及多表查詢和事物操作,感興趣的朋友一起看看吧2022-05-05DBA應(yīng)該知道的一些關(guān)于SQL Server跟蹤標(biāo)記的使用
本篇文章小編為大家介紹,DBA應(yīng)該知道的一些關(guān)于SQL Server跟蹤標(biāo)記的使用。需要的朋友參考下2013-04-04Sysbench對Mysql進(jìn)行基準(zhǔn)測試過程解析
這篇文章主要介紹了Sysbench對Mysql進(jìn)行基準(zhǔn)測試過程解析,文中通過示例代碼介紹的非常詳細(xì),對大家的學(xué)習(xí)或者工作具有一定的參考學(xué)習(xí)價值,需要的朋友可以參考下2020-11-11MYSQL根據(jù)分組獲取組內(nèi)多條數(shù)據(jù)中符合條件的一條(實(shí)例詳解)
這篇文章主要介紹了MYSQL根據(jù)分組獲取組內(nèi)多條數(shù)據(jù)中符合條件的一條,本文通過實(shí)例代碼給大家介紹的非常詳細(xì),對大家的學(xué)習(xí)或工作具有一定的參考借鑒價值,需要的朋友可以參考下2023-06-06MySQL系列理解運(yùn)用union(all)與limit及exists關(guān)鍵字教程
這篇文章主要為大家介紹了MySQL系列中union(all)、limit及exists關(guān)鍵字的教程示例講解,通過本篇文章就可以理解MySQL中的這些關(guān)鍵字的概念以及實(shí)際的運(yùn)用2021-10-10