欧美bbbwbbbw肥妇,免费乱码人妻系列日韩,一级黄片

詳解Java中String類型與默認(rèn)字符編碼

 更新時(shí)間:2019年05月05日 12:01:49   作者:Nuub  
這篇文章主要介紹了Java中String類型與默認(rèn)字符編碼,文中通過示例代碼介紹的非常詳細(xì),對(duì)大家的學(xué)習(xí)或者工作具有一定的參考學(xué)習(xí)價(jià)值,需要的朋友們下面隨著小編來一起學(xué)習(xí)學(xué)習(xí)吧

為什么寫這個(gè)

至于為什么要寫這個(gè),主要是一句mmp一定要講,繞了一上午,暈死
Java程序中的中文亂碼問題一直是一個(gè)困擾程序員的難題,自己也不例外,早在做項(xiàng)目時(shí)就遇到過很多編碼方式的坑,當(dāng)時(shí)想填來著,但是嫌麻煩。這次終于忍不住了,一定要弄個(gè)明白

String類型的編碼方式

從網(wǎng)上查的資料都說,Java默認(rèn)的字符編碼是Unicode,而String類型的編碼方式是與JVM編碼方式和本機(jī)操作系統(tǒng)默認(rèn)字符集有關(guān)的。于是我做出了測(cè)試
在Java中可以這樣顯示查看本地編碼方式(JVM還是OS呢?)

// Gets the system property indicated by the specified key.
System.out.println(System.getProperty(file.encoding));

看注釋上說是獲取系統(tǒng)字符集,但是我對(duì)這個(gè)系統(tǒng)的概念表示存疑,為什么呢,因?yàn)楸娝苤覀冎袊?guó)人的電腦大部分默認(rèn)的字符編碼方式就是GBK,在CMD中輸入chcp可以獲得一個(gè)數(shù)值936,這就表示了是GBK的編碼方式。

但是我自己運(yùn)行出這句話的結(jié)果竟然是UTF-8,我是在IDEA中運(yùn)行的,并且已經(jīng)使用IDEA設(shè)置了項(xiàng)目的編碼方式是UTF-8,出現(xiàn)這樣的結(jié)果我只能是猜測(cè)其實(shí)上面這句話是獲取JVM(跟隨項(xiàng)目的編碼方式)的編碼方式

接下來我們來回歸正題,String類型的默認(rèn)編碼方式是什么,有下面這幾句語句:

/* 測(cè)試String類型默認(rèn)的編碼方式
*/

// 使用String的有參構(gòu)造方法
String str = new String("hhhh ty智障%shfu摸淑芬十分uif內(nèi)服NSF黑");
// 1.以GBK編碼方式獲取str的字節(jié)數(shù)組,再用String有參構(gòu)造函數(shù)構(gòu)造字符串
System.out.println(new String(str.getBytes("GBK")));
// 2.以UTF-8編碼方式獲取str的字節(jié)數(shù)組,再以默認(rèn)編碼構(gòu)造字符串
System.out.println(new String(str.getBytes("UTF-8")));

下面來看一下運(yùn)行結(jié)果:

// 1.
hhhh ty����%shfu�����ʮ��uif�ڷ�NSF��i����ظ���u��Ϊ��ؼu ��δ���δ��� hhhh ty智障%shfu摸淑芬十分uif內(nèi)服NSF黑i飛鳥回復(fù)額u發(fā)為呢丶u 房未婚夫未婚夫
// 2.
hhhh ty智障%shfu摸淑芬十分uif內(nèi)服NSF黑i飛鳥回復(fù)額u發(fā)為呢丶u 房未婚夫未婚夫

 可以很明顯的可以看出,這里String類型默認(rèn)的字符編碼方式就是與我們查看本地系統(tǒng)的編碼方式相同。因此我們得出結(jié)論:String類型的默認(rèn)編碼方式是和本地編碼方式相關(guān)

String.getBytes()方法

我們大多數(shù)情況下是不使用String類型的,而是使用byte數(shù)組來傳輸操作數(shù)據(jù),一般會(huì)使用String.getBytes()方法來將字符串轉(zhuǎn)換成字節(jié)數(shù)組。但是這樣轉(zhuǎn)換的時(shí)候,會(huì)不會(huì)牽涉到編碼問題呢?仔細(xì)查看了String.getBytes()的源碼,分為無參的和有參的兩種:

// 1.無參的getBytes()方法
  public byte[] getBytes() {
    // 再繼續(xù)深入encode()方法可以發(fā)現(xiàn)使用的是系統(tǒng)默認(rèn)的字符編碼
    return StringCoding.encode(value, 0, value.length);
  }

// 2.帶參數(shù)的getBytes(String charsetName)方法
  public byte[] getBytes(String charsetName)
      throws UnsupportedEncodingException {
    if (charsetName == null) throw new NullPointerException();
    // 繼續(xù)深入可以發(fā)現(xiàn),會(huì)使用參數(shù)字符集編碼方式來返回字節(jié)數(shù)組,如果參數(shù)字符集不存在,則使用本地系統(tǒng)默認(rèn)的字符編碼
    return StringCoding.encode(charsetName, value, 0, value.length);
  }

綜上,在這里再?gòu)?qiáng)調(diào)一下,因?yàn)樾薷牧隧?xiàng)目的編碼方式,導(dǎo)致了本地系統(tǒng)的編碼方式也變成了UTF-8,所以上述的實(shí)驗(yàn)都是基于IDE修改了工程項(xiàng)目編碼方式的基礎(chǔ)上

ByteBuffer與byte數(shù)組的互相轉(zhuǎn)換

在NIO中,一般都是使用ByteBuffer來當(dāng)作字符緩沖,而有的時(shí)候我們只有byte[]數(shù)組,所以是需要它們之間進(jìn)行相互轉(zhuǎn)換的

// ByteBuffer ----> byte[]
byte[] bytes = ByteBuffer.array();

// byte[] ------> ByteBuffer
byte[] bytes = new byte[1024];
ByteBuffer byteBuffer = ByteBuffer.wrap(bytes);

So

綜上所述,再在這里總結(jié)一下:

  1. 本地JVM的編碼方式是和本機(jī)OS默認(rèn)的字符編碼方式相關(guān)的,但是JVM的編碼方式可以被修改
  2. Java程序的默認(rèn)字符集是Unicode,在程序中聲明的String類型的編碼方式是和JVM編碼方式相關(guān)的
  3. String.getBytes()方法默認(rèn)的編碼方式是JVM編碼方式;同時(shí)還可以接收一個(gè)字符集名稱當(dāng)作參數(shù),優(yōu)先使用參數(shù)的字符集
  4. 因?yàn)镴ava代碼使用的Unicode字符集,允許各編碼方式之間轉(zhuǎn)換,但不保證bit損失,所以String類型可以得到不同編碼方式的byte數(shù)組,只要按照編碼解碼的方式獲取字符串類型顯示即可
  5. 文件的流通道是根據(jù)文件的編碼方式?jīng)Q定的,所以不同編碼方式的文件讀寫時(shí)要注意編碼解碼
  6. ByteBuffer聲明的buffer可以與byte數(shù)組之間進(jìn)行轉(zhuǎn)換,但要注意的是ByteBuffer的大小一定要足夠大以承載下所有的byte數(shù)組

小總結(jié)

搞清楚了這些甚是豁然開朗,其實(shí)很多時(shí)候中文的亂碼問題根源就是編碼方式與解碼方式不一致,或者是不同編碼方式之間轉(zhuǎn)換時(shí)造成了bit損失。所以我們還是要注意規(guī)范化編碼與解碼方式,畢竟有的轉(zhuǎn)換操作是不可逆的。

以上所述是小編給大家介紹的Java中String類型與默認(rèn)字符編碼詳解整合,希望對(duì)大家有所幫助,如果大家有任何疑問請(qǐng)給我留言,小編會(huì)及時(shí)回復(fù)大家的。在此也非常感謝大家對(duì)腳本之家網(wǎng)站的支持!

相關(guān)文章

  • Java查找 List 中的最大最小值實(shí)例演示

    Java查找 List 中的最大最小值實(shí)例演示

    這篇文章主要介紹了JAVA得到數(shù)組中最大值和最小值的簡(jiǎn)單實(shí)例,需要的朋友可以參考下
    2017-04-04
  • mybatis整合spring實(shí)現(xiàn)開啟mapper.xml映射文件掃描

    mybatis整合spring實(shí)現(xiàn)開啟mapper.xml映射文件掃描

    這篇文章主要介紹了mybatis整合spring實(shí)現(xiàn)開啟mapper.xml映射文件掃描,具有很好的參考價(jià)值,希望對(duì)大家有所幫助。如有錯(cuò)誤或未考慮完全的地方,望不吝賜教
    2021-10-10
  • 詳解IDEA 中使用Maven創(chuàng)建項(xiàng)目常見錯(cuò)誤和使用技巧(推薦)

    詳解IDEA 中使用Maven創(chuàng)建項(xiàng)目常見錯(cuò)誤和使用技巧(推薦)

    這篇文章主要介紹了詳解IDEA 中使用Maven創(chuàng)建項(xiàng)目常見錯(cuò)誤和使用技巧(推薦),本文給大家介紹的非常詳細(xì),對(duì)大家的學(xué)習(xí)或工作具有一定的參考借鑒價(jià)值,需要的朋友可以參考下
    2020-07-07
  • Spring根據(jù)URL參數(shù)進(jìn)行路由的方法詳解

    Spring根據(jù)URL參數(shù)進(jìn)行路由的方法詳解

    這篇文章主要給大家介紹了關(guān)于Spring根據(jù)URL參數(shù)進(jìn)行路由的相關(guān)資料,文中通過示例代碼介紹的非常詳細(xì),對(duì)大家的學(xué)習(xí)或者工作具有一定的參考學(xué)習(xí)價(jià)值,需要的朋友們下面隨著小編來一起來看看吧。
    2017-12-12
  • Java Agent 動(dòng)態(tài)修改字節(jié)碼詳情

    Java Agent 動(dòng)態(tài)修改字節(jié)碼詳情

    這篇文章主要介紹了Java Agent動(dòng)態(tài)修改字節(jié)碼的相關(guān)資料,需要的朋友可以參考下面文章具體的內(nèi)容
    2021-09-09
  • IntelliJ IDEA 熱部署插件JRebel的使用

    IntelliJ IDEA 熱部署插件JRebel的使用

    這篇文章主要介紹了IntelliJ IDEA 熱部署插件JRebel的使用,小編覺得挺不錯(cuò)的,現(xiàn)在分享給大家,也給大家做個(gè)參考。一起跟隨小編過來看看吧
    2018-12-12
  • mybatis中如何傳遞單個(gè)String類型的參數(shù)

    mybatis中如何傳遞單個(gè)String類型的參數(shù)

    這篇文章主要介紹了mybatis中如何傳遞單個(gè)String類型的參數(shù),具有很好的參考價(jià)值,希望對(duì)大家有所幫助。如有錯(cuò)誤或未考慮完全的地方,望不吝賜教
    2021-11-11
  • SpringBoot實(shí)現(xiàn)反向代理的示例代碼

    SpringBoot實(shí)現(xiàn)反向代理的示例代碼

    本文主要介紹了SpringBoot實(shí)現(xiàn)反向代理的示例代碼,文中通過示例代碼介紹的非常詳細(xì),對(duì)大家的學(xué)習(xí)或者工作具有一定的參考學(xué)習(xí)價(jià)值,需要的朋友們下面隨著小編來一起學(xué)習(xí)學(xué)習(xí)吧
    2023-06-06
  • Java如何主動(dòng)從當(dāng)前線程獲取異常信息

    Java如何主動(dòng)從當(dāng)前線程獲取異常信息

    這篇文章主要介紹了Java如何主動(dòng)從當(dāng)前線程獲取異常信息,具有很好的參考價(jià)值,希望對(duì)大家有所幫助。如有錯(cuò)誤或未考慮完全的地方,望不吝賜教
    2022-10-10
  • 淺談java是如何做資源回收補(bǔ)救的

    淺談java是如何做資源回收補(bǔ)救的

    這篇文章主要介紹了淺談java是如何做資源回收補(bǔ)救的,文中通過示例代碼介紹的非常詳細(xì),對(duì)大家的學(xué)習(xí)或者工作具有一定的參考學(xué)習(xí)價(jià)值,需要的朋友們下面隨著小編來一起學(xué)習(xí)學(xué)習(xí)吧
    2020-06-06

最新評(píng)論