SQL語句執(zhí)行超時(shí)引發(fā)網(wǎng)站首頁訪問故障問題
非常抱歉,今天早上 6:37~8:15 期間,由于獲取網(wǎng)站首頁博文列表的 SQL 語句出現(xiàn)突發(fā)的查詢超時(shí)問題,造成訪問網(wǎng)站首頁時(shí)出現(xiàn) 500 錯(cuò)誤,由此給您帶來麻煩,請您諒解。
故障的情況是這樣的。
故障期間日志中記錄了大量下面的錯(cuò)誤。
2020-02-03 06:37:24.635 [Error] An unhandled exception has occurred while executing the request./Microsoft.AspNetCore.Diagnostics.ExceptionHandlerMiddlewareSystem.Data.SqlClient.SqlException (0x80131904): Timeout expired. The timeout period elapsed prior to completion of the operation or the server is not responding. ---> System.ComponentModel.Win32Exception (258): Unknown error 258 at System.Data.SqlClient.SqlCommand.<>c.<ExecuteDbDataReaderAsync>b__126_0(Task`1 result)
數(shù)據(jù)庫服務(wù)器(阿里云 RDS SQL Server 2016 實(shí)例)的 CPU 消耗突增。
數(shù)據(jù)庫服務(wù)器的 IOPS 暴增。
通過阿里云 RDS 控制臺的 CloudDBA 可以查看到故障期間獲取首頁博文的 SQL 語句被執(zhí)行了3萬多次,執(zhí)行這么多次是由于查詢超時(shí),無法建立緩存,每次請求都要訪問數(shù)據(jù)庫。
發(fā)現(xiàn)故障后,我們通過阿里云 RDS 的主備切換恢復(fù)了正常。
經(jīng)過對故障的排查分析,鎖定的最大嫌疑對象是 SQL Server 參數(shù)嗅探(詳見園子里的博文 什么是 SQL Server 參數(shù)嗅探)。
對于這種因?yàn)橹赜盟松傻膱?zhí)行計(jì)劃而導(dǎo)致的水土不服現(xiàn)象,SQL Server 有一個(gè)專有名詞,叫“參數(shù)嗅探 parameter sniffing”。
而且我們找到了引發(fā) SQL Server 參數(shù)嗅探問題的條件。
在我們的 open api 中提供了獲取首頁博文列表的 web api ,但沒有限制可以獲取的最大博文數(shù),也就是下面的 ItemCount 參數(shù)(除了 open api ,其他地方調(diào)用時(shí) ItemCount 值都是 20 )。
SELECT TOP (@ItemCount)
假如有人調(diào)用 open api 時(shí)給 ItemCount 傳了一個(gè)很大的值,比如 20000 ,雖然調(diào)用的是同樣的 SQL 語句,但由于 ItemCount 的值不同, SQL Server 可能會(huì)生成相差很大的執(zhí)行計(jì)劃,對于 ItemCount 20000 性能比較好的執(zhí)行計(jì)劃,對于 ItemCount 20 可能性能極差。如果查詢 ItemCount 20000 時(shí)生成的執(zhí)行計(jì)劃被緩存下來,查詢 ItemCount 20 時(shí)繼續(xù)使用這個(gè)執(zhí)行計(jì)劃,就會(huì)出現(xiàn)本來好好的 SQL 查詢突然變得性能極差。我們今天遇到的故障很可能就是這個(gè)原因,而且故障時(shí)就一個(gè) SQL 語句出現(xiàn)問題(正好就這個(gè) SQL 查詢緩存了水土不服的執(zhí)行計(jì)劃),其他都正常,也驗(yàn)證了這個(gè)猜測。
通過這次故障,我們吸取的教訓(xùn)是一定要在代碼中對 ItemCount 與 PageSize 的最大值進(jìn)行限制,它不僅僅是帶來不必要的低性能查詢,而且可能會(huì)因?yàn)?SQL Server 參數(shù)嗅探問題拖垮整個(gè)數(shù)據(jù)庫。
總結(jié)
以上所述是小編給大家介紹的SQL語句執(zhí)行超時(shí)引發(fā)網(wǎng)站首頁訪問故障問題,希望對大家有所幫助!
相關(guān)文章
SQL對冗余數(shù)據(jù)的刪除重復(fù)記錄只保留單條的說明
本文講一下數(shù)據(jù)庫中通常存在一些冗余數(shù)據(jù),如重復(fù)記錄就是一種,那這樣的記錄如何刪除呢?2010-03-03SQL Server誤區(qū)30日談 第28天 有關(guān)大容量事務(wù)日志恢復(fù)模式的誤區(qū)
在大容量事務(wù)日志恢復(fù)模式下只有一小部分批量操作可以被“最小記錄日志”,這類操作的列表可以在Operations That Can Be Minimally Logged找到。這是適合SQL Server 2008的列表,對于不同的SQL Server版本,請確保查看正確的列表2013-01-01SQL查詢語句行轉(zhuǎn)列橫向顯示實(shí)例解析
這篇文章主要為大家詳細(xì)介紹了兩個(gè)關(guān)于SQL查詢語句行轉(zhuǎn)列橫向顯示的實(shí)例解析,感興趣的小伙伴們可以參考一下2016-05-05SQL Server游標(biāo)的使用/關(guān)閉/釋放/優(yōu)化小結(jié)
游標(biāo)打破了這一查詢的思考是面向集合的規(guī)則,游標(biāo)使得我們思考方式變?yōu)橹鹦羞M(jìn)行,接下來為大家介紹下游標(biāo)的使用感興趣的朋友可以參考下哈,希望可以幫助到你2013-03-03SQL中g(shù)roupBy和eq的同時(shí)使用問題
groupBy和eq同時(shí)使用可能會(huì)導(dǎo)致錯(cuò)誤,本文就來介紹一下SQL中g(shù)roupBy和eq的同時(shí)使用問題,感興趣的可以了解一下2024-05-05SQL Server 2016 CTP2.3 的關(guān)鍵特性總結(jié)
SQL Server2016 CTP2.2是微軟數(shù)據(jù)平臺歷史上邁出最大的一步,更快的事務(wù)處理和查詢、任何設(shè)備更深入的洞察力、更先進(jìn)的分析能力、全新安全技術(shù)和全新的混合云場景,本文給大家介紹SQL Server 2016 CTP2.3 的關(guān)鍵特性總結(jié),需要的朋友可以參考下2015-09-09SQLServer中NEWID()函數(shù)用于生成一個(gè)唯一的標(biāo)識符的方法實(shí)踐
NEWID函數(shù)用于生成一個(gè)唯一的標(biāo)識符,本文主要介紹了SQLServer中NEWID()函數(shù)用于生成一個(gè)唯一的標(biāo)識符的方法實(shí)踐,具有一定的參考價(jià)值,感興趣的可以了解一下2024-08-08SQL一條語句統(tǒng)計(jì)記錄總數(shù)及各狀態(tài)數(shù)
這篇文章主要為大家介紹了SQL一條語句統(tǒng)計(jì)記錄總數(shù)及各狀態(tài)數(shù)的sql語句,需要的朋友可以參考下2013-12-12