Java String字符串和Unicode字符相互轉(zhuǎn)換代碼詳解
網(wǎng)上大部分有關(guān)“Java String字符串和Unicode字符相互轉(zhuǎn)換代碼”的博文幾乎都僅是將全為Unicode字符的字符串進(jìn)行轉(zhuǎn)換,而我們?nèi)粘:芸赡苄枰氖菍⒒煊衅胀ㄗ址腢nicode一并轉(zhuǎn)換(例如“\u0061\u0062\u0063(123)”,我們希望轉(zhuǎn)換成“abc(123)”,而實(shí)際上網(wǎng)上的通用方法并不符合該需求,運(yùn)行即報(bào)錯(cuò)),普通字符跳過而Unicode字符要進(jìn)行轉(zhuǎn)換,在進(jìn)行字符串的查找替換截取什么的使用正則表達(dá)式往往是個(gè)很好的選擇。
因此作者我結(jié)合了網(wǎng)上提供的方法結(jié)合正則i表達(dá)式實(shí)現(xiàn)該需求!
在進(jìn)行代碼講解時(shí)我先貼出實(shí)現(xiàn)代碼:
網(wǎng)上一般實(shí)現(xiàn)代碼:
字符串轉(zhuǎn)換unicode java方法代碼片段:
/** * 字符串轉(zhuǎn)換unicode * @param string * @return */ public static String string2Unicode(String string) { StringBuffer unicode = new StringBuffer(); for (int i = 0; i < string.length(); i++) { // 取出每一個(gè)字符 char c = string.charAt(i); // 轉(zhuǎn)換為unicode unicode.append("\\u" + Integer.toHexString(c)); } return unicode.toString(); }
unicode轉(zhuǎn)換字符串java方法代碼片段:
/** * unicode 轉(zhuǎn)字符串 * @param unicode 全為 Unicode 的字符串 * @return */ public static String unicode2String(String unicode) { StringBuffer string = new StringBuffer(); String[] hex = unicode.split("\\\\u"); for (int i = 1; i < hex.length; i++) { // 轉(zhuǎn)換出每一個(gè)代碼點(diǎn) int data = Integer.parseInt(hex[i], 16); // 追加成string string.append((char) data); } return string.toString();
結(jié)合正則實(shí)現(xiàn)的代碼:
混有普通字符的Unicode轉(zhuǎn)換為字符串:
/** * 含有unicode 的字符串轉(zhuǎn)一般字符串 * @param unicodeStr 混有 Unicode 的字符串 * @return */ public static String unicodeStr2String(String unicodeStr) { int length = unicodeStr.length(); int count = 0; //正則匹配條件,可匹配“\\u”1到4位,一般是4位可直接使用 String regex = "\\\\u[a-f0-9A-F]{4}"; String regex = "\\\\u[a-f0-9A-F]{1,4}"; Pattern pattern = Pattern.compile(regex); Matcher matcher = pattern.matcher(unicodeStr); StringBuffer sb = new StringBuffer(); while(matcher.find()) { String oldChar = matcher.group();//原本的Unicode字符 String newChar = unicode2String(oldChar);//轉(zhuǎn)換為普通字符 // int index = unicodeStr.indexOf(oldChar); // 在遇見重復(fù)出現(xiàn)的unicode代碼的時(shí)候會(huì)造成從源字符串獲取非unicode編碼字符的時(shí)候截取索引越界等 int index = matcher.start(); sb.append(unicodeStr.substring(count, index));//添加前面不是unicode的字符 sb.append(newChar);//添加轉(zhuǎn)換后的字符 count = index+oldChar.length();//統(tǒng)計(jì)下標(biāo)移動(dòng)的位置 } sb.append(unicodeStr.substring(count, length));//添加末尾不是Unicode的字符 return sb.toString(); }
完整代碼:
package util; import java.util.regex.Matcher; import java.util.regex.Pattern; /** * * <p>Title: String 與 Unicode 互相轉(zhuǎn)換的工具類</p> * <p>Description: </p> * <p>Company: SCAU@Copyright</p> * @Copyright 1.0 * @author jodenhe (824923282@qq.com) * @version 1.0 * @since 2017年8月17日 下午9:42:50 */ public class StringUnicodeUtil { /** * 含有unicode 的字符串轉(zhuǎn)一般字符串 * @param unicodeStr 混有 Unicode 的字符串 * @return */ public static String unicodeStr2String(String unicodeStr) { int length = unicodeStr.length(); int count = 0; //正則匹配條件,可匹配“\\u”1到4位,一般是4位可直接使用 String regex = "\\\\u[a-f0-9A-F]{4}"; String regex = "\\\\u[a-f0-9A-F]{1,4}"; Pattern pattern = Pattern.compile(regex); Matcher matcher = pattern.matcher(unicodeStr); StringBuffer sb = new StringBuffer(); while(matcher.find()) { String oldChar = matcher.group();//原本的Unicode字符 String newChar = unicode2String(oldChar);//轉(zhuǎn)換為普通字符 // int index = unicodeStr.indexOf(oldChar); // 在遇見重復(fù)出現(xiàn)的unicode代碼的時(shí)候會(huì)造成從源字符串獲取非unicode編碼字符的時(shí)候截取索引越界等 int index = matcher.start(); sb.append(unicodeStr.substring(count, index));//添加前面不是unicode的字符 sb.append(newChar);//添加轉(zhuǎn)換后的字符 count = index+oldChar.length();//統(tǒng)計(jì)下標(biāo)移動(dòng)的位置 } sb.append(unicodeStr.substring(count, length));//添加末尾不是Unicode的字符 return sb.toString(); } /** * 字符串轉(zhuǎn)換unicode * @param string * @return */ public static String string2Unicode(String string) { StringBuffer unicode = new StringBuffer(); for (int i = 0; i < string.length(); i++) { // 取出每一個(gè)字符 char c = string.charAt(i); // 轉(zhuǎn)換為unicode unicode.append("\\u" + Integer.toHexString(c)); } return unicode.toString(); } /** * unicode 轉(zhuǎn)字符串 * @param unicode 全為 Unicode 的字符串 * @return */ public static String unicode2String(String unicode) { StringBuffer string = new StringBuffer(); String[] hex = unicode.split("\\\\u"); for (int i = 1; i < hex.length; i++) { // 轉(zhuǎn)換出每一個(gè)代碼點(diǎn) int data = Integer.parseInt(hex[i], 16); // 追加成string string.append((char) data); } return string.toString(); } public static void main(String[] args) { String str = "abc"; String str2 = string2Unicode(str); System.out.println(str2); System.out.println(unicodeStr2String(str2)); System.out.println(unicodeStr2String("\\u61HJ\\u62\\u63(sfkfdsl)")); } }
代碼運(yùn)行結(jié)果圖:
重要代碼講解:
代碼的實(shí)現(xiàn)其實(shí)很簡單,因此只對(duì)核心主要代碼進(jìn)行講解,如對(duì)代碼有疑惑可私信或留下評(píng)論!
1、正則匹配規(guī)則:
String regex = \\\\u[a-f0-9A-F]{1,4};
這個(gè)是正則匹配的規(guī)則,可能你會(huì)疑惑為什么使用“\\\\u”來匹配javan字符串的“\\u”,原因很簡單,因?yàn)檫@樣才匹配得上嘛(開個(gè)玩笑)直接看測試圖1-2
測試圖1:
測試圖2:
很明顯在菜鳥上使用兩種匹配方式匹配到的結(jié)果是不同的,而java字符串需要轉(zhuǎn)義,上圖的“\u”java就應(yīng)該是“\\u”,因此就要使用“\\\\u”來進(jìn)行匹配!
[a-f0-9A-F]{1,4}
”[a-f0-9A-F]“ :這個(gè)意思就是a到f,0到9,A到F出現(xiàn)的數(shù)都符合要求,“{1,4}”意思是前面的字符出現(xiàn)1到4個(gè)(其實(shí)一般的Unicode都是“\u”后面家4個(gè)字符的,如“\u0061”代表“a”,因此該式子可改為“\\\\u[a-f0-9A-F]{4}”,這樣可能更符合實(shí)際要求)
其余的代碼部分可查看源文件的注釋,應(yīng)該是可以理解的,慢慢推敲一下,應(yīng)該不難。
以上所述是小編給大家介紹的Java String字符串和Unicode字符相互轉(zhuǎn)換代碼詳解整合,希望對(duì)大家有所幫助,如果大家有任何疑問請(qǐng)給我留言,小編會(huì)及時(shí)回復(fù)大家的。在此也非常感謝大家對(duì)腳本之家網(wǎng)站的支持!
相關(guān)文章
利用Spring Session和redis對(duì)Session進(jìn)行共享詳解
這篇文章主要給大家介紹了關(guān)于利用Spring、Session和redis對(duì)Session進(jìn)行共享的相關(guān)資料,文中通過示例代碼介紹的非常詳細(xì),對(duì)大家的學(xué)習(xí)或者工作具有一定的參考學(xué)習(xí)價(jià)值,需要的朋友們下面隨著小編來一起學(xué)習(xí)學(xué)習(xí)吧。2017-09-09SpringBoot整合JPA數(shù)據(jù)源方法及配置解析
這篇文章主要介紹了SpringBoot整合JPA數(shù)據(jù)源方法及配置解析,文中通過示例代碼介紹的非常詳細(xì),對(duì)大家的學(xué)習(xí)或者工作具有一定的參考學(xué)習(xí)價(jià)值,需要的朋友可以參考下2020-08-08Spring Boot 集成Shiro的多realm配置過程
這篇文章主要介紹了Spring Boot 集成Shiro的多realm配置,本文給大家介紹的非常詳細(xì),對(duì)大家的學(xué)習(xí)或工作具有一定的參考借鑒價(jià)值,需要的朋友可以參考下2020-10-10Spring 整合Shiro 并擴(kuò)展使用EL表達(dá)式的實(shí)例詳解
Shiro是一個(gè)輕量級(jí)的權(quán)限控制框架,應(yīng)用非常廣泛。本文的重點(diǎn)是介紹Spring整合Shiro,并通過擴(kuò)展使用Spring的EL表達(dá)式。需要的朋友可以參考下2018-03-03在攔截器中讀取request參數(shù),解決在controller中無法二次讀取的問題
這篇文章主要介紹了在攔截器中讀取request參數(shù),解決在controller中無法二次讀取的問題,具有很好的參考價(jià)值,希望對(duì)大家有所幫助。如有錯(cuò)誤或未考慮完全的地方,望不吝賜教2021-10-10SpringBoot2整合Drools規(guī)則引擎及案例詳解
這篇文章主要介紹了SpringBoot2整合Drools規(guī)則引擎及案例詳解,文中通過示例代碼介紹的非常詳細(xì),對(duì)大家的學(xué)習(xí)或者工作具有一定的參考學(xué)習(xí)價(jià)值,需要的朋友可以參考下2019-10-10SpringBoot導(dǎo)出Excel的四種實(shí)現(xiàn)方式
近期接到了一個(gè)小需求,要將系統(tǒng)中的數(shù)據(jù)導(dǎo)出為Excel,且能將Excel數(shù)據(jù)導(dǎo)入到系統(tǒng),對(duì)于大多數(shù)研發(fā)人員來說,這算是一個(gè)最基本的操作了,本文就給大家總結(jié)一下SpringBoot導(dǎo)出Excel的四種實(shí)現(xiàn)方式,需要的朋友可以參考下2024-01-01SVN導(dǎo)入maven項(xiàng)目報(bào)錯(cuò)解決方案
這篇文章主要介紹了SVN導(dǎo)入maven項(xiàng)目報(bào)錯(cuò)解決方案,文中通過示例代碼介紹的非常詳細(xì),對(duì)大家的學(xué)習(xí)或者工作具有一定的參考學(xué)習(xí)價(jià)值,需要的朋友可以參考下2020-12-12