關(guān)于Java垃圾回收開(kāi)銷降低的幾條建議
保持GC低開(kāi)銷的竅門有哪些?
隨著一再拖延而即將發(fā)布的 Java9,G1(“Garbage First”)垃圾回收器將被成為 HotSpot 虛擬機(jī)默認(rèn)的垃圾回收器。從 serial 垃圾回收器到CMS 收集器, JVM 見(jiàn)證了許多 GC 實(shí)現(xiàn),而 G1 將成為其下一代垃圾回收器。
隨著垃圾收集器的發(fā)展,每一代 GC 與其上一代相比,都帶來(lái)了巨大的進(jìn)步和改善。parallel GC 與 serial GC 相比,它讓垃圾收集器以多線程的方式工作,充分利用了多核計(jì)算機(jī)的計(jì)算能力。CMS(“Concurrent Mark-Sweep”)收集器與 parallel GC 相比,它將回收過(guò)程分成了多個(gè)階段,使得應(yīng)用線程正在運(yùn)行的時(shí)候,收集工作可以并發(fā)地完成,大大改善了頻繁執(zhí)行 “stop-the-world” 的情況。G1 對(duì)于擁有大量堆內(nèi)存的 JVM 表現(xiàn)出更好的性能,并且具有更好的可預(yù)測(cè)和統(tǒng)一的暫停過(guò)程。
Tip #1: 預(yù)測(cè)集合的容量
所有標(biāo)準(zhǔn)的 Java 集合,包括定制和擴(kuò)展的實(shí)現(xiàn)(比如 Trove 和 Google 的 Guava),底層都使用了數(shù)組(原生數(shù)據(jù)類型或者基于對(duì)象的類型)。因?yàn)閿?shù)組一旦被分配,其大小就不可變,因此添加元素到集合時(shí),大多數(shù)情況下都會(huì)導(dǎo)致需要重新申請(qǐng)一個(gè)新的大容量數(shù)組替換老的數(shù)組(指集合底層實(shí)現(xiàn)使用的數(shù)組)。
即使沒(méi)有提供集合初始化的大小,大多數(shù)集合的實(shí)現(xiàn)都盡量?jī)?yōu)化重新分配數(shù)組的處理并且將其開(kāi)銷平攤到最低。不過(guò),在構(gòu)造集合的時(shí)候就提供大小可以得到最佳的效果。
讓我們將下面的代碼作為一個(gè)簡(jiǎn)單的例子分析一下:
public static List reverse(List & lt; ? extends T & gt; list) { List result = new ArrayList(); for (int i = list.size() - 1; i & gt; = 0; i--) { result.add(list.get(i)); } return result; }
This method allocates a new array, then fills it up with items from another list, only in reverse order. 這個(gè)方法分配了一個(gè)新的數(shù)組,然后用另一個(gè) list 中元素對(duì)該數(shù)組進(jìn)行填充,只是元素的數(shù)序發(fā)生了變化。
這個(gè)處理方式可能會(huì)付出慘重的性能代價(jià),其優(yōu)化的點(diǎn)在添加元素到新的 list 中這行代碼。 隨著每一次添加元素,list 都需要確保其底層數(shù)組擁有足夠的位置來(lái)容納新的元素。如果有空閑的位置,那么只是簡(jiǎn)單地將新元素存儲(chǔ)到下一個(gè)空閑的槽位。如果沒(méi)有的話,將分配一個(gè)新的底層數(shù)組,拷貝舊的數(shù)組內(nèi)容到新的數(shù)組中,然后添加新的元素。這將導(dǎo)致多次分配數(shù)組,那些剩余的舊數(shù)組最終被 GC 所回收。
我們可以通過(guò)在構(gòu)造集合時(shí)讓其底層的數(shù)組知道它將存儲(chǔ)多少元素,從而避免這些多余的分配
public static List reverse(List & lt; ? extends T & gt; list) { List result = new ArrayList(list.size()); for (int i = list.size() - 1; i & gt; = 0; i--) { result.add(list.get(i)); } return result; }
上面的代碼通過(guò) ArrayList 的構(gòu)造器指定足夠大的空間來(lái)存儲(chǔ) list.size()
個(gè)元素,在初始化時(shí)完成分配的執(zhí)行,這意味著 List 在迭代的過(guò)程中無(wú)需再次分配內(nèi)存。
Guava 的集合類則更進(jìn)一步,允許初始化集合時(shí)明確指定期望元素的個(gè)數(shù)或者指定一個(gè)預(yù)測(cè)值。
List result = Lists.newArrayListWithCapacity(list.size()); List result = Lists.newArrayListWithExpectedSize(list.size());
上面的代碼中,前者用于我們已經(jīng)準(zhǔn)確地知道集合將要存儲(chǔ)多少元素,而后者的分配方式考慮了錯(cuò)誤預(yù)估的情況。
Tip #2:直接處理數(shù)據(jù)流
當(dāng)處理數(shù)據(jù)流時(shí),比如從一個(gè)文件讀取數(shù)據(jù)或者從網(wǎng)絡(luò)中下載數(shù)據(jù),下面的代碼是非常常見(jiàn)的:
byte[] fileData = readFileToByteArray(new File("myfile.txt"));
所產(chǎn)生的字節(jié)數(shù)組可能被解析 XML 文檔、JSON 對(duì)象或者協(xié)議緩沖消息,以及一些常見(jiàn)的可選項(xiàng)。
當(dāng)處理大文件或者文件的大小無(wú)法預(yù)測(cè)時(shí),上面的做法很是不明智的,因?yàn)楫?dāng) JVM 無(wú)法分配一個(gè)緩沖區(qū)來(lái)處理真正文件時(shí),就會(huì)導(dǎo)致OutOfMemeoryErrors。
即使數(shù)據(jù)的大小是可管理的,當(dāng)?shù)嚼厥諘r(shí),使用上面的模式依然會(huì)造成巨大的開(kāi)銷,因?yàn)樗诙阎蟹峙淞艘粔K非常大的區(qū)域來(lái)存儲(chǔ)文件數(shù)據(jù)。
一種更加好的處理方式是使用合適的 InputStream (比如在這個(gè)例子中使用 FileInputStream)直接傳遞給解析器,不再一次性將整個(gè)文件讀取到一個(gè)字節(jié)數(shù)組中。所有主流的開(kāi)源庫(kù)都提供相應(yīng)的 API 來(lái)直接接受一個(gè)輸入流進(jìn)行處理,比如:
FileInputStream fis = new FileInputStream(fileName); MyProtoBufMessage msg = MyProtoBufMessage.parseFrom(fis);
Tip #3: 使用不可變的對(duì)象
不變性有太多的好處。甚至不用我贅述什么。然而,有一個(gè)優(yōu)點(diǎn)會(huì)對(duì)垃圾回收產(chǎn)生影響,應(yīng)該關(guān)注一下。
一個(gè)不可變對(duì)象的屬性在對(duì)象被創(chuàng)建后就不能被修改(在這里的例子使用的是引用數(shù)據(jù)類型的屬性),比如:
public class ObjectPair { private final Object first; private final Object second; public ObjectPair(Object first, Object second) { this.first = first; this.second = second; } public Object getFirst() { return first; } public Object getSecond() { return second; } }
將上面的類實(shí)例化后會(huì)產(chǎn)生一個(gè)不可變對(duì)象—它的所有屬性用 final 修飾,構(gòu)造完成后就不能改變了。
不可變性意味著所有被一個(gè)不可變?nèi)萜魉玫膶?duì)象,在容器構(gòu)造完成前對(duì)象就已經(jīng)被創(chuàng)建。就 GC 而言:這個(gè)容器年輕程度至少和其所持有的最年輕的引用一樣。這意味著當(dāng)在年輕代執(zhí)行垃圾回收的過(guò)程中,GC 因?yàn)椴豢勺儗?duì)象處于老年代而跳過(guò)它們,直到確定這些不可變對(duì)象在老年代中不被任何對(duì)象所引用時(shí),才完成對(duì)它們的回收。
更少的掃描對(duì)象意味著對(duì)內(nèi)存頁(yè)更少的掃描,越少的掃描內(nèi)存頁(yè)就意味著更短的 GC 生命周期,也意味著更短的 GC 暫停和更好的總吞吐量。
Tip #4: 小心字符串拼接
字符串可能是在所有基于 JVM 應(yīng)用程序中最常用的非原生數(shù)據(jù)結(jié)構(gòu)。然而,由于其隱式地開(kāi)銷負(fù)擔(dān)和簡(jiǎn)便的使用,非常容易成為占用大量?jī)?nèi)存的罪歸禍?zhǔn)住?/p>
這個(gè)問(wèn)題很明顯不在于字符串字面值,而是在運(yùn)行時(shí)分配內(nèi)存初始化產(chǎn)生的。讓我們快速看一下動(dòng)態(tài)構(gòu)建字符串的例子:
public static String toString(T[] array) { String result = "["; for (int i = 0; i & lt; array.length; i++) { result += (array[i] == array ? "this" : array[i]); if (i & lt; array.length - 1) { result += ", "; } } result += "]"; return result; }
這是個(gè)看似不錯(cuò)的方法,接收一個(gè)字符數(shù)組然后返回一個(gè)字符串。但是這對(duì)于對(duì)象內(nèi)存分配卻是災(zāi)難性的。
很難看清這語(yǔ)法糖的背后,但是幕后的實(shí)際情況是這樣的:
public static String toString(T[] array) { String result = "["; for (int i = 0; i & lt; array.length; i++) { StringBuilder sb1 = new StringBuilder(result); sb1.append(array[i] == array ? "this" : array[i]); result = sb1.toString(); if (i & lt; array.length - 1) { StringBuilder sb2 = new StringBuilder(result); sb2.append(", "); result = sb2.toString(); } } StringBuilder sb3 = new StringBuilder(result); sb3.append("]"); result = sb3.toString(); return result; }
字符串是不可變的,這意味著每發(fā)生一次拼接時(shí),它們本身不會(huì)被修改,而是依次分配新的字符串。此外,編譯器使用了標(biāo)準(zhǔn)的 StringBuilder 類來(lái)執(zhí)行這些拼接操作。這就會(huì)有問(wèn)題了,因?yàn)槊恳淮蔚?,既隱式地分配了一個(gè)臨時(shí)字符串,又隱式分配了一個(gè)臨時(shí)的 StringBuilder 對(duì)象來(lái)幫助構(gòu)建最終的結(jié)果。
最佳的方式是避免上面的情況,使用 StringBuilder 和直接的追加,以取代本地拼接操作符(“+”)。下面是一個(gè)例子:
public static String toString(T[] array) { StringBuilder sb = new StringBuilder("["); for (int i = 0; i & lt; array.length; i++) { sb.append(array[i] == array ? "this" : array[i]); if (i & lt; array.length - 1) { sb.append(", "); } } sb.append("]"); return sb.toString(); }
這里,我們只在方法開(kāi)始的時(shí)候分配了唯一的一個(gè) StringBuilder。至此,所有的字符串和 list 中的元素都被追加到單獨(dú)的一個(gè)StringBuilder中。最終使用 toString()
方法一次性將其轉(zhuǎn)成成字符串返回。
Tip #5: 使用特定的原生類型的集合
Java 標(biāo)準(zhǔn)的集合庫(kù)簡(jiǎn)單且支持泛型,允許在使用集合時(shí)對(duì)類型進(jìn)行半靜態(tài)地綁定。比如想要?jiǎng)?chuàng)建一個(gè)只存放字符串的 Set 或者存儲(chǔ) Map<Pair, List>
這樣的 map,這種處理方式是非常棒的。
真正的問(wèn)題源于當(dāng)我們想要使用一個(gè) list 存儲(chǔ) int 類型,或者一個(gè) map 存儲(chǔ) double 類型作為 value。因?yàn)榉盒筒恢С衷鷶?shù)據(jù)類型,因此另外的一種選擇是使用包裝類型來(lái)進(jìn)行替換,這里我們使用 List 。
這種處理方式是非常浪費(fèi)的,因?yàn)橐粋€(gè) Integer 是一個(gè)完全的對(duì)象,一個(gè)對(duì)象的頭部占用12個(gè)字節(jié)以及其內(nèi)部的所維護(hù)的 int 屬性,每個(gè)Integer 對(duì)象總共占用16個(gè)字節(jié)。這比起存儲(chǔ)相同個(gè)數(shù)的 int 類型的 list 而言,其消耗的空間是它的四倍!比這個(gè)更加嚴(yán)重的問(wèn)題在于,事實(shí)上因?yàn)?Integer 是真正的對(duì)象實(shí)例,因此它需要垃圾收集階段被垃圾收集器所考慮是否要回收。
為了處理這個(gè)問(wèn)題,我們?cè)?Takipi 中使用非常棒的 Trove 集合庫(kù)。Trove 摒棄了部分泛型的特定來(lái)支持特定的使用內(nèi)存更高效的原生類型的集合。比如,我們使用非常消耗性能的 Map<Integer, Double>
,在 Trove 中有另一種特別的選擇方案,其形式為 TIntDoubleMap
TIntDoubleMap map = new TIntDoubleHashMap(); map.put(5, 7.0); map.put(-1, 9.999); ...
Trove 的底層實(shí)現(xiàn)使用了原生類型的數(shù)組,所以當(dāng)操作集合的時(shí)候不會(huì)發(fā)生元素的裝箱(int->Integer
)或者拆箱(Integer->int
), 沒(méi)有存儲(chǔ)對(duì)象,因?yàn)榈讓邮褂迷鷶?shù)據(jù)類型存儲(chǔ)。
最后
隨著垃圾收集器持續(xù)的改進(jìn),以及運(yùn)行時(shí)的優(yōu)化和 JIT 編譯器也變得越來(lái)越智能。我們作為開(kāi)發(fā)者將會(huì)發(fā)現(xiàn)越來(lái)越少地考慮如何編寫 GC 友好的代碼。然而,就目前階段,不論 G1 如何改進(jìn),我們?nèi)匀挥泻芏嗫梢宰龅氖聛?lái)幫 JVM 提升性能。
好了,以上就是這篇文章的全部?jī)?nèi)容了,希望本文的內(nèi)容對(duì)大家學(xué)習(xí)或者使用Java能帶來(lái)一定的幫助,如果有疑問(wèn)大家可以留言交流。
- Java垃圾回收之標(biāo)記壓縮算法詳解
- Java垃圾回收之復(fù)制算法詳解
- Java垃圾回收之標(biāo)記清除算法詳解
- 詳解Java內(nèi)存管理中的JVM垃圾回收
- Java垃圾回收機(jī)制簡(jiǎn)述
- 簡(jiǎn)單介紹Java垃圾回收機(jī)制
- 快速理解Java垃圾回收和jvm中的stw
- 老生常談Java虛擬機(jī)垃圾回收機(jī)制(必看篇)
- 老生常談java垃圾回收算法(必看篇)
- Java 垃圾回收機(jī)制詳解及實(shí)例代碼
- Java垃圾回收器的方法和原理總結(jié)
- 詳解Java虛擬機(jī)(JVM)運(yùn)行時(shí)
- 優(yōu)化Java虛擬機(jī)總結(jié)(jvm調(diào)優(yōu))
- Java垃圾回收之分代收集算法詳解
相關(guān)文章
Spring使用@Autowired注解實(shí)現(xiàn)自動(dòng)裝配方式
這篇文章主要介紹了Spring使用@Autowired注解實(shí)現(xiàn)自動(dòng)裝配方式,具有很好的參考價(jià)值,希望對(duì)大家有所幫助。如有錯(cuò)誤或未考慮完全的地方,望不吝賜教2021-09-09SpringBoot集成Sharding-JDBC實(shí)現(xiàn)分庫(kù)分表方式
這篇文章主要介紹了SpringBoot集成Sharding-JDBC實(shí)現(xiàn)分庫(kù)分表方式,具有很好的參考價(jià)值,希望對(duì)大家有所幫助,如有錯(cuò)誤或未考慮完全的地方,望不吝賜教2024-07-07Java使用ProcessBuilder?API優(yōu)化流程
Java?的?Process?API?為開(kāi)發(fā)者提供了執(zhí)行操作系統(tǒng)命令的強(qiáng)大功能,這篇文章將詳細(xì)介紹如何使用?ProcessBuilder?API?來(lái)方便的操作系統(tǒng)命令,需要的可以收藏一下2023-06-06java 數(shù)據(jù)的加密與解密普遍實(shí)例代碼
本篇文章介紹了一個(gè)關(guān)于密鑰查詢的jsp文件簡(jiǎn)單實(shí)例代碼,需要的朋友可以參考下2017-04-04SpringBoot使用@EnableAutoConfiguration實(shí)現(xiàn)自動(dòng)配置詳解
你有想過(guò)SpringBoot為什么能夠自動(dòng)的幫我們創(chuàng)建一個(gè)Bean對(duì)象么?或許在我們使用的時(shí)候只需要在自己自定義的配置文件中加入@Bean對(duì)象就可以,但SpringBoot是如何來(lái)創(chuàng)建的呢2022-08-08Springboot項(xiàng)目基于Devtools實(shí)現(xiàn)熱部署步驟詳解
這篇文章主要介紹了Springboot項(xiàng)目基于Devtools實(shí)現(xiàn)熱部署,文中通過(guò)示例代碼介紹的非常詳細(xì),對(duì)大家的學(xué)習(xí)或者工作具有一定的參考學(xué)習(xí)價(jià)值,需要的朋友可以參考下2020-06-06