欧美bbbwbbbw肥妇,免费乱码人妻系列日韩,一级黄片

JDK9對String字符串的新一輪優(yōu)化

 更新時(shí)間:2021年03月16日 15:07:34   作者:程序新視界  
這篇文章主要介紹了JDK9對String字符串的新一輪優(yōu)化,本文給大家介紹的非常詳細(xì),對大家的學(xué)習(xí)或工作具有一定的參考借鑒價(jià)值,需要的朋友可以參考下

String類可以說是Java編程中使用最多的類了,如果能對String字符串的性能進(jìn)行優(yōu)化,那么程序的性能必然能大幅提升。

這不JDK9就對String字符串進(jìn)行了改進(jìn)升級,在某些場景下可以讓String字符串內(nèi)存減少一半,進(jìn)而減少JVM的GC次數(shù)。

String的底層存儲

在面試的時(shí)候我們通常會說String字符串有不可變的特性,每次都要創(chuàng)建新的字符串。那么,為什么String字符串是不可變的呢?

先來看一下String字符串的底層存儲結(jié)構(gòu):

public final class String
  implements java.io.Serializable, Comparable<String>, CharSequence {
  
  private final char value[];

  public String() {
    this.value = "".value;
  }

  public String(String original) {
    this.value = original.value;
    this.hash = original.hash;
  }
  // ...
}  

看到什么了?當(dāng)我們new一個(gè)String對象時(shí),對應(yīng)的字符串其實(shí)是以char數(shù)組的形式存儲在String對象內(nèi)部。而這個(gè)char數(shù)組是final的,也就是說不可變的。

這也就是為什么我們說String字符串擁有不可變的特性,當(dāng)字符串改變了,char數(shù)組不可變,就只能創(chuàng)建一個(gè)新的對象,新的char數(shù)組了。

底層存儲的優(yōu)化

上面說的情況是JDK8及以前版本,到了JDK9,String中字符串的存儲不再用char數(shù)組了,改用byte數(shù)組。

public final class String
  implements java.io.Serializable, Comparable<String>, CharSequence {

  @Stable
  private final byte[] value;

  private final byte coder;
  
  @Native static final byte LATIN1 = 0;
  @Native static final byte UTF16 = 1;
  
  static final boolean COMPACT_STRINGS;
 
  public String() {
    this.value = "".value;
    this.coder = "".coder;
  }

  @HotSpotIntrinsicCandidate
  public String(String original) {
    this.value = original.value;
    this.coder = original.coder;
    this.hash = original.hash;
  }
  
  // ...
}

不僅將char數(shù)組改為byte數(shù)組,而且新增了一個(gè)coder的成員變量。

在程序中,絕大多數(shù)字符串只包含英文字母數(shù)字等字符,使用Latin-1編碼,一個(gè)字符占用一個(gè)byte。如果使用char,一個(gè)char要占用兩個(gè)byte,會占用雙倍的內(nèi)存空間。

但是,如果字符串中使用了中文等超出Latin-1表示范圍的字符,使用Latin-1就沒辦法表示了。這時(shí)JDK會使用UTF-16編碼,那么占用的空間和舊版(使用char[])是一樣的。

coder變量代表編碼的格式,目前String支持兩種編碼格式Latin-1和UTF-16。Latin-1需要用一個(gè)字節(jié)來存儲,而UTF-16需要使用2個(gè)字節(jié)或者4個(gè)字節(jié)來存儲。

據(jù)說這一改進(jìn)方案是JDK的開發(fā)人員用大數(shù)據(jù)和人工能智能,調(diào)研了成千上萬的應(yīng)用程序的heapdump信息后,得出:大部分的String都是以Latin-1字符編碼來表示的,只需要一個(gè)字節(jié)存儲就夠了,兩個(gè)字節(jié)完全是浪費(fèi)。

COMPACT_STRINGS屬性則是用來控制是否開啟String的compact功能。默認(rèn)情況下是開啟的??梢允褂?XX:-CompactStrings參數(shù)來對此功能進(jìn)行關(guān)閉。

改進(jìn)的好處

改進(jìn)的好處是非常明顯的,首先如果項(xiàng)目中使用Latin-1字符集居多,內(nèi)存的占用大幅度減少,同樣的硬件配置可以支撐更多的業(yè)務(wù)。

當(dāng)內(nèi)存減少之后,進(jìn)一步導(dǎo)致減少GC次數(shù),進(jìn)而減少Stop-The-World的頻次,同樣會提升系統(tǒng)的性能。

小結(jié)

隨著JDK的迭代String字符串的內(nèi)存結(jié)構(gòu)及方法等也在不斷地進(jìn)行演變。這是因?yàn)镾tring字符串往往是JVM中占用內(nèi)存最多的類,通過對它的改造升級,對性能的提升會更加明顯。

到此這篇關(guān)于JDK9對String字符串的新一輪優(yōu)化的文章就介紹到這了,更多相關(guān)JDK9對String字符串優(yōu)化內(nèi)容請搜索腳本之家以前的文章或繼續(xù)瀏覽下面的相關(guān)文章希望大家以后多多支持腳本之家!

相關(guān)文章

最新評論