java 字符串截取的實(shí)例詳解
java 字符串截取的實(shí)例詳解
題目
在java中,字符串“abcd”與字符串“ab你好”的長(zhǎng)度是一樣,都是四個(gè)字符。
但對(duì)應(yīng)的字節(jié)數(shù)不同,一個(gè)漢字占兩個(gè)字節(jié)。
定義一個(gè)方法,按照指定的字節(jié)數(shù)來(lái)取子串。
如:對(duì)于“ab你好”,如果取三個(gè)字節(jié),那么子串就是ab與“你”字的半個(gè),那么半個(gè)就要舍棄。
如果取四個(gè)字節(jié)就是“ab你”,取五個(gè)字節(jié)還是“ab你”。
僅考慮GBK和utf-8編碼
實(shí)例代碼:
import java.io.UnsupportedEncodingException;
import org.junit.Test;
/**
* @author<a href="mailto:953801304@qq.com" rel="external nofollow" >胡龍華</a>
* @version 2017-4-4 下午1:08:45
* @fileName StringCut.java
*/
public class StringCut {
@Test
public void analyze(){
String str1 = "你好abc";
byte[] bs1=null;
byte[] bs2=null;
try {
bs1 = str1.getBytes("GBK");
System.out.println("---GBK---");
for(byte b:bs1){
System.out.print(b+" ");
}
System.out.println();
//-60 -29 -70 -61 97 98 99
// 發(fā)現(xiàn)規(guī)律,再gbk中一個(gè)中文漢字 都是以兩個(gè)字節(jié) 小于0的數(shù)存儲(chǔ)
bs2 = str1.getBytes("utf-8");
System.out.println("---utf-8---");
for(byte b:bs2){
System.out.print(b+" ");
}
//-28 -67 -96 -27 -91 -67 97 98 99
// 發(fā)現(xiàn)規(guī)律,在utf-8中一個(gè)中文漢字 是以三個(gè)字節(jié) 小于0 的數(shù)存儲(chǔ)
} catch (UnsupportedEncodingException e) {
e.printStackTrace();
}
}
/**
* 思路:從第len個(gè)往前數(shù),連續(xù)2的倍數(shù)個(gè)負(fù)數(shù)則全部輸出,單數(shù)個(gè)則去掉最后一個(gè)輸出
* @param str
* @param len
* @return
*/
private static String StringCutByGBK(String str,int len){
byte[] bs = null;
try {
int count = 0;
bs = str .getBytes("GBK");
for(int i=len-1;i>=0;i--){
if(bs[i]<0){
count++;
}else{
break;
}
// 0 1 2 3 4 5 6 7 8 9 10 11 12
} //-60 -29 -70 -61 -80 -95 97 98 99 -76 -17 -72 -25
if(count%2==0){
String s=new String(bs, 0, len, "GBK");
System.out.println("截取"+len+"個(gè)字符:"+s);
}else{
String s=new String(bs, 0, len-1, "GBK");
System.out.println("截取"+len+"個(gè)字符:"+s);
}
} catch (UnsupportedEncodingException e) {
e.printStackTrace();
}
return null;
}
/**
* 思路:從第len個(gè)往前數(shù),連續(xù)3的倍數(shù)個(gè)負(fù)數(shù)則全部輸出,其他情況則去掉最后count%3個(gè)輸出
* @param str
* @param len
* @return
*/
private static String StringCutByUTF8(String str,int len){
byte[] bs = null;
try {
int count = 0;
bs = str .getBytes("UTF-8");
for(int i=len-1;i>=0;i--){
if(bs[i]<0){
count++;
}else{
break;
}
}
// 0 1 2 3 4 5 6 7 8 9 10 11 12
//-60 -29 -70 -61 -80 -95 97 98 99 -76 -17 -72 -25
if(count%3==0){
String s=new String(bs, 0, len, "UTF-8");
System.out.println("截取"+len+"個(gè)字符:"+s);
}else{
String s=new String(bs, 0, len-count%3, "UTF-8");
System.out.println("截取"+len+"個(gè)字符:"+s);
}
} catch (UnsupportedEncodingException e) {
e.printStackTrace();
}
return null;
}
@Test
public void TEST() {
String str = "你好啊abc達(dá)哥";
try {
System.out.println("---測(cè)試gbk---");
byte bs [] = str.getBytes("GBK");
for(int i=0;i<=bs.length;i++){
//System.out.print(bs[i]+" ");
StringCutByGBK(str,i);
}
System.out.println("---測(cè)試UTF-8---");
byte bs2 [] = str.getBytes("utf-8");
for(int i=0;i<=bs2.length;i++){
//System.out.print(bs[i]+" ");
StringCutByUTF8(str,i);
}
} catch (UnsupportedEncodingException e) {
// TODO Auto-generated catch block
e.printStackTrace();
}
}
}
如有疑問(wèn)請(qǐng)留言或者到本站社區(qū)交流討論,感謝閱讀,希望能幫助到大家,謝謝大家對(duì)本站的支持!
相關(guān)文章
springboot 如何解決static調(diào)用service為null
這篇文章主要介紹了springboot 如何解決static調(diào)用service為null的問(wèn)題,具有很好的參考價(jià)值,希望對(duì)大家有所幫助。如有錯(cuò)誤或未考慮完全的地方,望不吝賜教2021-06-06
java 異常之手動(dòng)拋出與自動(dòng)拋出的實(shí)例講解
這篇文章主要介紹了java 異常之手動(dòng)拋出與自動(dòng)拋出的實(shí)例講解,具有很好的參考價(jià)值,希望對(duì)大家有所幫助。一起跟隨小編過(guò)來(lái)看看吧2021-02-02
淺析Java中Apache BeanUtils和Spring BeanUtils的用法
這篇文章主要介紹了Java中Apache BeanUtils和Spring BeanUtils的用法,本文通過(guò)實(shí)例代碼給大家介紹的非常詳細(xì),對(duì)大家的學(xué)習(xí)或工作具有一定的參考借鑒價(jià)值,需要的朋友可以參考下2020-11-11
Java遞歸實(shí)現(xiàn)評(píng)論多級(jí)回復(fù)功能
這篇文章主要介紹了Java遞歸實(shí)現(xiàn)評(píng)論多級(jí)回復(fù)功能,本文通過(guò)實(shí)例代碼給大家介紹的非常詳細(xì),對(duì)大家的學(xué)習(xí)或工作具有一定的參考借鑒價(jià)值,需要的朋友可以參考下2022-06-06
SpringBoot Redis配置多數(shù)據(jù)源的項(xiàng)目實(shí)踐
springboot中默認(rèn)的redis配置是只能對(duì)單個(gè)redis庫(kù)進(jìn)行操作的, 那么我們需要多個(gè)庫(kù)操作的時(shí)候這個(gè)時(shí)候就可以采用redis多數(shù)據(jù)源 ,本文就介紹了SpringBoot Redis配置多數(shù)據(jù)源,感興趣的可以了解一下2023-07-07
Java8新特性Stream流中anyMatch和allMatch和noneMatch的區(qū)別解析
這篇文章主要介紹了Java8新特性Stream流中anyMatch和allMatch和noneMatch的區(qū)別解析,本文給大家介紹的非常詳細(xì),對(duì)大家的學(xué)習(xí)或工作具有一定的參考借鑒價(jià)值,需要的朋友參考下吧2024-01-01
DOM解析XML報(bào)錯(cuò)Content is not allowed in prolog解決方案詳解
這篇文章主要介紹了DOM解析XML報(bào)錯(cuò)解決方案詳解,文中通過(guò)示例代碼介紹的非常詳細(xì),對(duì)大家的學(xué)習(xí)或者工作具有一定的參考學(xué)習(xí)價(jià)值,需要的朋友可以參考下2020-10-10
Java并發(fā)之異步的八種實(shí)現(xiàn)方式
本文主要介紹了Java并發(fā)之異步的八種實(shí)現(xiàn)方式,文中通過(guò)示例代碼介紹的非常詳細(xì),對(duì)大家的學(xué)習(xí)或者工作具有一定的參考學(xué)習(xí)價(jià)值,需要的朋友們下面隨著小編來(lái)一起學(xué)習(xí)學(xué)習(xí)吧2023-06-06

