自增長鍵列統(tǒng)計信息的處理方法

更新時間：2015年07月23日 11:34:45 投稿：mrr

在這篇文章展示了SQL Server的查詢優(yōu)化器如何使用自增長鍵列統(tǒng)計信息,大家都知道SQLServer里每個統(tǒng)計信息對象都有關聯(lián)的直方圖直方圖用多個步長描述指定列數(shù)據(jù)分布情況,需要的朋友可以參考下

這篇文章通過文字代碼的形式講解了如何處理用自增長鍵列的統(tǒng)計信息。我們都知道，在SQL Server里每個統(tǒng)計信息對象都有關聯(lián)的直方圖。直方圖用多個步長描述指定列數(shù)據(jù)分布情況。在一個直方圖里，SQL Server最大支持200的步長，但當你查詢的數(shù)據(jù)范圍在直方圖最后步長后，這是個問題。我們來看下面的代碼，重現(xiàn)這個情形：

 -- Create a simple orders table
 CREATE TABLE Orders
 (
  OrderDate DATE NOT NULL,
  Col2 INT NOT NULL,
  Col3 INT NOT NULL
 )
 GO
 
 -- Create a Non-Unique Clustered Index on the table
 CREATE CLUSTERED INDEX idx_CI ON Orders(OrderDate)
 GO
 
 -- Insert 31465 rows from the AdventureWorks2008r2 database
 INSERT INTO Orders (OrderDate, Col2, Col3) SELECT OrderDate, CustomerID, TerritoryID FROM AdventureWorks2008R2.Sales.SalesOrderHeader
 GO
 
 -- Rebuild the Clustered Index, so that we get fresh statistics.
 -- The last value in the Histogram is 2008-07-31.
 ALTER INDEX idx_CI ON Orders REBUILD
 GO
 
 -- Insert 200 additional rows *after* the last step in the Histogram
 INSERT INTO Orders (OrderDate, Col2, Col3)
 VALUES ('20100101', 1, 1)
 GO 200

在索引重建后，我們再看下直方圖，我們發(fā)現(xiàn)最后步進的值是2008-07-31。

復制代碼代碼如下:

DBCC SHOW_STATISTICS('dbo.Orders', 'idx_CI') WITH HISTOGRAM

你已經(jīng)看到，在最后步進到表里后，我們插入了200條額外記錄。這樣的話，直方圖并沒有真實反饋實際的數(shù)據(jù)分布情況，但SQL Server還是要進行基數(shù)計算。我們現(xiàn)在來看看在不同版本里SQL Server是如何處理這個問題的。

復制代碼代碼如下:

SQL Server 2005 SP1- SQL Server 2012

在SQL Server 2014之前，基數(shù)計算對此問題的處理非常簡單：SQL Server估計行數(shù)為1，你可以從下面的圖片里看到。

點擊工具欄的顯示包含實際的執(zhí)行計劃，并執(zhí)行如下查詢：

復制代碼代碼如下:

SELECT * FROM dbo.Orders WHERE OrderDate='2010-01-01'

自SQL Server 2005 SP1起，查詢優(yōu)化器可以標記1列為自增長（Ascending）來克服剛才介紹的限制。如果你用自增長列值更新了統(tǒng)計信息對象3次，那列就會被標記為自增長列。為了看有沒有列標記為自增長，你可以使用跟蹤標記2388。當你啟用這個跟蹤標記，DBCC SHOW_STATISTICS的輸出就改變了，有額外列返回。

復制代碼代碼如下:

DBCC TRACEON(2388)

DBCC SHOW_STATISTICS('dbo.Orders', 'idx_CI')

現(xiàn)在下面的代碼更新統(tǒng)計信息3次，每次用自增長鍵列值在我們聚集索引末尾插入行。

 -- => 1st update the Statistics on the table with a FULLSCAN
  UPDATE STATISTICS Orders WITH FULLSCAN
  GO
  
  -- Insert 200 additional rows *after* the last step in the Histogram
  INSERT INTO Orders (OrderDate, Col2, Col3)
 VALUES ('20100201', 1, 1)
  GO 200
  
 -- => 2nd update the Statistics on the table with a FULLSCAN
 UPDATE STATISTICS Orders WITH FULLSCAN
 GO
 
 -- Insert 200 additional rows *after* the last step in the Histogram
 INSERT INTO Orders (OrderDate, Col2, Col3)
 VALUES ('20100301', 1, 1)
 GO 200
 
 -- => 3rd update the Statistics on the table with a FULLSCAN
 UPDATE STATISTICS Orders WITH FULLSCAN
 GO

然后，當我們執(zhí)行DBCC SHOW_STATISTICS命令，你會看到SQL Server已講那列標記為Ascending。

復制代碼代碼如下:

DBCC TRACEON(2388)

DBCC SHOW_STATISTICS('dbo.Orders', 'idx_CI')

現(xiàn)在當你再次執(zhí)行查詢不是直方圖范圍的數(shù)據(jù)時，沒有任何改變。為了使用標記為自增長鍵列，你要啟用另外一個跟蹤標記-2389。如果你啟用這個跟蹤標記，查詢優(yōu)化器就是密度向量（Density Vector）來進行基數(shù)計算。

-- Now we query the newly inserted range which is currently not present in the Histogram.
-- With Trace Flag 2389, the Query Optimizer uses the Density Vector to make the Cardinality Estimation.
SELECT * FROM Orders
WHERE OrderDate = '20100401'
OPTION (RECOMPILE, QUERYTRACEON 2389)
GO

來看下現(xiàn)在的表密度：

復制代碼代碼如下:

DBCC TRACEOFF(2388)

DBCC SHOW_STATISTICS('dbo.Orders', 'idx_CI')

現(xiàn)在的表密度是0.0008873115，因此查詢優(yōu)化器的估計行數(shù)是28.4516：0.0008873115*（32265-200）。

這雖然不是最好的結果，但比估計行數(shù)1好很多！

（這里有問題，我本地是SQL Server 2008r2，測試估計行數(shù)還是1，不知原因，望知道的朋友解釋下，多謝！)

SQL Server 2014
在SQL Server 2014引入的一個新功能是新基數(shù)計算。新基數(shù)計算對于自增長鍵問題的處理非常簡單：默認不使用任何跟蹤標記，來使用統(tǒng)計信息對象的密度向量來進行基數(shù)計算。下面查詢啟用2312跟蹤標記的基數(shù)計算來運行同個查詢。

1 -- With the new Cardinality Estimator SQL Server estimates 28.4516 rows at the Clustered Index Seek operator.
2 SELECT * FROM Orders
3 WHERE OrderDate = '20100401'
4 OPTION (RECOMPILE, QUERYTRACEON 2312)
5 GO

我們來看這里的基數(shù)計算，你會看到查詢優(yōu)化器再次估計行數(shù)是28.4516，但這一次沒表上自增長。這是SQL Server 2014的自帶功能。

（SQL Server 2014測試失敗，估計行數(shù)也是1……）

在這篇文章，我向你展示了SQL Server的查詢優(yōu)化器如何處理自增長鍵問題。在SQL Server 2014之前，你需要啟用2389跟蹤標記來獲得更好的基數(shù)計算——這樣的話那列會標記為自增長（ascending）。SQL Server 2014，查詢優(yōu)化器默認就使用密度向量來進行基數(shù)計算，這樣就方便很多。我希望你對此有所收獲，在SQL Server里如何處理自增長鍵列問題你會有更好的想法。

希望對大家有所啟迪，謝謝。

您可能感興趣的文章: