MySQL?驅(qū)動中虛引用?GC?耗時優(yōu)化與源碼分析
本文要點:
- 一種優(yōu)雅解決 MySQL 驅(qū)動中虛引用導(dǎo)致 GC 耗時較長問題的解決方法
- 虛引用的作用與使用場景
- MySQL 驅(qū)動源碼中的虛引用分析
背景
在之前文章中寫過 MySQL JDBC 驅(qū)動中的虛引用導(dǎo)致 JVM GC 耗時較長的問題(可以看這里),在驅(qū)動代碼(mysql-connector-java 5.1.38版本)中 NonRegisteringDriver 類有個虛引用集合 connectionPhantomRefs 用于存儲所有的數(shù)據(jù)庫連接,NonRegisteringDriver.trackConnection 方法負(fù)責(zé)把新創(chuàng)建的連接放入集合,虛引用隨著時間積累越來越多,導(dǎo)致 GC 時處理虛引用的耗時較長,影響了服務(wù)的吞吐量:
public ConnectionImpl(String hostToConnectTo, int portToConnectTo, Properties info, String databaseToConnectTo, String url) throws SQLException { ... NonRegisteringDriver.trackConnection(this); ... }
public class NonRegisteringDriver implements Driver { ... ?protected static final ConcurrentHashMap<ConnectionPhantomReference, ConnectionPhantomReference> connectionPhantomRefs = new ConcurrentHashMap(); protected static void trackConnection(com.mysql.jdbc.Connection newConn) { ? ? ? ?ConnectionPhantomReference phantomRef = new ConnectionPhantomReference((ConnectionImpl)newConn, refQueue); ? ? ? ?connectionPhantomRefs.put(phantomRef, phantomRef); ? } ... }
嘗試減少數(shù)據(jù)庫連接的生成速度,來降低虛引用的數(shù)量,但是效果并不理想。最終的解決方案是通過反射獲取虛引用集合,利用定時任務(wù)來定期清理集合,避免 GC 處理虛引用耗時較長。
// 每兩小時清理 connectionPhantomRefs,減少對 mixed GC 的影響 SCHEDULED_EXECUTOR.scheduleAtFixedRate(() -> { try { Field connectionPhantomRefs = NonRegisteringDriver.class.getDeclaredField("connectionPhantomRefs"); connectionPhantomRefs.setAccessible(true); Map map = (Map) connectionPhantomRefs.get(NonRegisteringDriver.class); if (map.size() > 50) { map.clear(); } } catch (Exception e) { log.error("connectionPhantomRefs clear error!", e); } }, 2, 2, TimeUnit.HOURS);
利用定時任務(wù)清理虛引用效果立竿見影,每日幾億請求的服務(wù) mixed GC 耗時只有 10 - 30 毫秒左右,系統(tǒng)也很穩(wěn)定,線上運行將近一年沒有任何問題。
優(yōu)化——由暴力破解到優(yōu)雅配置
最近又有同事遇到相同的問題,使用的 mysql-connector-java 版本與我們使用的版本一致,查看最新版本(8.0.32)的代碼發(fā)現(xiàn)對數(shù)據(jù)庫連接的虛引用有新的處理方式,不像老版本(5.1.38)中每一個連接都會生成虛引用,而是可以通過參數(shù)來控制是否需要生成。類 AbandonedConnectionCleanupThread
的相關(guān)代碼如下:
//靜態(tài)變量通過 System.getProperty 獲取配置 private static boolean abandonedConnectionCleanupDisabled = Boolean.getBoolean("com.mysql.cj.disableAbandonedConnectionCleanup"); public static boolean getBoolean(String name) { return parseBoolean(System.getProperty(name)); } protected static void trackConnection(MysqlConnection conn, NetworkResources io) { //判斷配置的屬性值來決定是否需要生成虛引用 if (!abandonedConnectionCleanupDisabled) { ··· ConnectionFinalizerPhantomReference reference = new ConnectionFinalizerPhantomReference(conn, io, referenceQueue); connectionFinalizerPhantomRefs.add(reference); ··· } }
mysql-connector-java 的維護(hù)者應(yīng)該是注意到了虛引用對 GC 的影響,所以優(yōu)化了代碼,讓用戶可以自定義虛引用的生成。
有了這個配置,就可以在啟動參數(shù)上設(shè)置屬性:
java -jar app.jar -Dcom.mysql.cj.disableAbandonedConnectionCleanup=true
或者在代碼里設(shè)置屬性:
System.setProperty(PropertyDefinitions.SYSP_disableAbandonedConnectionCleanup,"true");
當(dāng) com.mysql.cj.disableAbandonedConnectionCleanup=true 時,生成數(shù)據(jù)庫連接時就不會生成虛引用,對 GC 就沒有任何影響了。
建議還是使用第一種方式,通過啟動參數(shù)配置更靈活一點。
什么是虛引用
有些讀者看到這里知道 mysql-connector-java 生成的虛引用對 GC 有一些副作用,但是還不太了解虛引用到底是什么,有什么作用,這里我們在虛引用上做一點點拓展。
Java 虛引用(Phantom Reference)是Java中一種特殊的引用類型,它是最弱的一種引用。與其他引用不同,虛引用并不會影響對象的生命周期,也不會影響對象的垃圾回收。虛引用主要用于在對象被回收時收到系統(tǒng)通知,以便在回收時執(zhí)行一些必要的清理工作。
上述虛引用的定義還是比較難理解,我們用代碼來輔助理解:
先來生成一個虛引用:
//虛引用隊列 ReferenceQueue<Object> queue = new ReferenceQueue<>(); //關(guān)聯(lián)對象 Object o = new Object(); //調(diào)用構(gòu)造方法生成一個虛引用 第一個參數(shù)就是關(guān)聯(lián)對象 第二個參數(shù)是關(guān)聯(lián)隊列 PhantomReference<Object> phantomReference = new PhantomReference<>(o, queue); //執(zhí)行垃圾回收 System.gc(); //延時確?;厥胀戤? Thread.sleep(300L); //當(dāng) Object o 被回收時可以從虛引用隊列里獲取到與之關(guān)聯(lián)的虛引用 這里就是 phantomReference 這個對象 Reference<?> poll = queue.poll();
虛引用的構(gòu)造方法需要兩個入?yún)?,第一個就是關(guān)聯(lián)的對象、第二個是虛引用隊列 ReferenceQueue。虛引用需要和 ReferenceQueue 配合使用,當(dāng)對象 Object o 被垃圾回收時,與 Object o 關(guān)聯(lián)的虛引用就會被放入到 ReferenceQueue 中。通過從 ReferenceQueue 中是否存在虛引用來判斷對象是否被回收。
我們再來理解上面對虛引用的定義,虛引用不會影響對象的生命周期,也不會影響對象的垃圾回收。如果上述代碼里的phantomReference 是一個普通的對象,那么在執(zhí)行 System.gc() 時 Object o 一定不會被回收掉,因為普通對象持有 Object o 的強(qiáng)引用,還不會被作為垃圾。這里的 phantomReference 是一個虛引用的話 Object o 就會被直接回收掉。然后會將關(guān)聯(lián)的虛引用放到隊列里,這就是虛引用關(guān)聯(lián)對象被回收時會收到系統(tǒng)通知的機(jī)制。
一些實踐能力很強(qiáng)的讀者會復(fù)制上述代碼去運行,發(fā)現(xiàn)垃圾回收之后隊列里并沒有虛引用。這是因為 Object o 還在棧里,屬于是 GC Root 的一種,不會被垃圾回收。我們可以這樣改寫:
static ReferenceQueue<Object> queue = new ReferenceQueue<>(); public static void main(String[] args) throws InterruptedException { PhantomReference<Object> phantomReference = buildReference(); System.gc();Thread.sleep(100); System.out.println(queue.poll()); } public static PhantomReference<Object> buildReference() { Object o = new Object(); return new PhantomReference<>(o, queue); }
不在 main 方法里實例化關(guān)聯(lián)對象 Object o,而是利用一個 buildReference 方法來實例化,這樣在執(zhí)行垃圾回收的時候,Object o 已經(jīng)出棧了,不再是 GC Root,會被當(dāng)做垃圾來回收。這樣就能從虛引用隊列里取出關(guān)聯(lián)的虛引用進(jìn)行后續(xù)處理。
關(guān)聯(lián)對象真的被回收了嗎
執(zhí)行完垃圾回收之后,我們確實能從虛引用隊列里獲取到虛引用了,我們可以思考一下,與該虛引用關(guān)聯(lián)的對象真的已經(jīng)被回收了嗎?
使用一個小實驗來探索答案:
public static void main(String[] args) { ReferenceQueue<byte[]> queue = new ReferenceQueue<>(); PhantomReference<byte[]> phantomReference = new PhantomReference<>( new byte[1024 * 1024 * 2], queue); System.gc();Thread.sleep(100L); System.out.println(queue.poll()); byte[] bytes = new byte[1024 * 1024 * 4]; }
代碼里生成一個虛引用,關(guān)聯(lián)對象是一個大小為 2M 的數(shù)組,執(zhí)行垃圾回收之后嘗試再實例化一個大小為 4M 的數(shù)組。如果我們從虛引用隊列里獲取到虛引用的時候關(guān)聯(lián)對象已經(jīng)被回收,那么就能正常申請到 4M 的數(shù)組。(設(shè)置堆內(nèi)存大小為 5M -Xmx5m -Xms5m)
執(zhí)行代碼輸出如下:
java.lang.ref.PhantomReference@533ddba
Exception in thread "main" java.lang.OutOfMemoryError: Java heap space
at com.ppphuang.demo.phantomReference.PhantomReferenceDemo.main(PhantomReferenceDemo.java:15)
從輸出可以看到,申請 4M 內(nèi)存的時候內(nèi)存溢出,那么問題的答案就很明顯了,關(guān)聯(lián)對象并沒有被真正的回收,內(nèi)存也沒有被釋放。
再做一點小小的改造,實例化新數(shù)組的之前將虛引用直接置為 null,這樣關(guān)聯(lián)對象就能被真正的回收掉,也能申請足夠的內(nèi)存:
public static void main(String[] args) { ReferenceQueue<byte[]> queue = new ReferenceQueue<>(); PhantomReference<byte[]> phantomReference = new PhantomReference<>( new byte[1024 * 1024 * 2], queue); System.gc();Thread.sleep(100L); System.out.println(queue.poll()); //虛引用直接置為 null phantomReference = null; byte[] bytes = new byte[1024 * 1024 * 4]; }
如果我們使用了虛引用,但是沒有及時清理虛引用的話可能會導(dǎo)致內(nèi)存泄露。
虛引用的使用場景——mysql-connector-java 虛引用源碼分析
讀到這里相信你已經(jīng)了解了虛引用的一些基本情況,那么它的使用場景在哪里呢?
最典型的場景就是最開始寫到的 mysql-connector-java 里處理 MySQL 連接的兜底邏輯。用虛引用來包裝 MySQL 連接,如果一個連接對象被回收的時候,會從虛引用隊列里收到通知,如果有些連接沒有被正確關(guān)閉的話,就會在回收之前進(jìn)行連接關(guān)閉的操作。
從 mysql-connector-java 的 AbandonedConnectionCleanupThread 類代碼中可以發(fā)現(xiàn)并沒有使用原生的 PhantomReference 對象,而是使用的是包裝過的 ConnectionFinalizerPhantomReference,增加了一個屬性 NetworkResources,這是為了方便從虛引用隊列中的虛引用上獲取到需要處理的資源。包裝類中還有一個 finalizeResources 方法,用來關(guān)閉網(wǎng)絡(luò)連接:
private static class ConnectionFinalizerPhantomReference extends PhantomReference<MysqlConnection> { //放置需要GC后后置處理的網(wǎng)絡(luò)資源 private NetworkResources networkResources; ConnectionFinalizerPhantomReference(MysqlConnection conn, NetworkResources networkResources, ReferenceQueue<? super MysqlConnection> refQueue) { super(conn, refQueue); this.networkResources = networkResources; } void finalizeResources() { if (this.networkResources != null) { try { this.networkResources.forceClose(); } finally { this.networkResources = null; } } } }
AbandonedConnectionCleanupThread 實現(xiàn)了 Runnable 接口,在 run 方法里循環(huán)讀取虛引用隊列 referenceQueue 里的虛引用,然后調(diào)用 finalizeResource 方法來進(jìn)行后置的處理,避免連接泄露:
public void run() { while(true) { try { ... Reference<? extends MysqlConnection> reference = referenceQueue.remove(5000L); if (reference != null) { //強(qiáng)轉(zhuǎn)為 ConnectionFinalizerPhantomReference finalizeResource((ConnectionFinalizerPhantomReference)reference); } ... } } } private static void finalizeResource(ConnectionFinalizerPhantomReference reference) { try { //兜底處理網(wǎng)絡(luò)資源 reference.finalizeResources(); reference.clear(); } finally { //移除虛引用 避免可能造成的內(nèi)存溢出 connectionFinalizerPhantomRefs.remove(reference); } }
如果你希望在某些對象被回收的時候做一些后置工作,可以參考 mysql-connector-java 中的一些實現(xiàn)邏輯。
總結(jié)
本文簡述了一種優(yōu)雅解決 MySQL 驅(qū)動中虛引用導(dǎo)致 GC 耗時較長問題的解決方法、也根據(jù)自己的理解講述了虛引用的作用、結(jié)合 MySQL 驅(qū)動的源碼描述了虛引用的使用場景,希望對你能有所幫助,更多關(guān)于MySQL 驅(qū)動中虛引用 GC 耗時優(yōu)化與源碼分析的資料請關(guān)注腳本之家其它相關(guān)文章!
相關(guān)文章
Mysql中的排序規(guī)則utf8_unicode_ci、utf8_general_ci的區(qū)別總結(jié)
Mysql中utf8_general_ci與utf8_unicode_ci有什么區(qū)別呢?在編程語言中,通常用unicode對中文字符做處理,防止出現(xiàn)亂碼,那么在MySQL里,為什么大家都使用utf8_general_ci而不是utf8_unicode_ci呢?2014-04-04MySQL通過binlog恢復(fù)數(shù)據(jù)
通過了解binlog日志的相關(guān)配置,簡單掌握通過binlog對數(shù)據(jù)庫進(jìn)行數(shù)據(jù)恢復(fù)操作。有此需求的朋友可以參考下2021-05-05MySQL系統(tǒng)庫之performance_schema的實現(xiàn)
performance_schema用于收集和存儲關(guān)于數(shù)據(jù)庫性能和資源利用情況的信息,本文主要介紹了MySQL系統(tǒng)庫之performance_schema的實現(xiàn),具有一定的參考價值,感興趣的可以了解一下2023-11-11mysql千萬級數(shù)據(jù)分頁查詢性能優(yōu)化
本文給大家分享的是作者在使用mysql進(jìn)行千萬級數(shù)據(jù)量分頁查詢的時候進(jìn)行性能優(yōu)化的方法,非常不錯的一篇文章,對我們學(xué)習(xí)mysql性能優(yōu)化非常有幫助2017-11-11

Red?Hat?安裝MySQL?8.0與?Navicat的詳細(xì)過程