欧美bbbwbbbw肥妇,免费乱码人妻系列日韩,一级黄片

C++中漢字字符串的截取

 更新時(shí)間:2013年05月03日 11:59:21   作者:  
C++中漢字字符串的截取,需要的朋友可以參考一下

1、

復(fù)制代碼 代碼如下:

const char *str = "test測(cè)試test";
while(*str)
{
//這里只需要判斷第一個(gè)字節(jié)大于0x80就行了,前提是輸入的是合法的GBK字符串
//原因在于,如果第一個(gè)字節(jié)大于0x80,那么它必然和后面一個(gè)字節(jié)一起組成一個(gè)漢字
//所以就沒(méi)有必要再去判斷后面一個(gè)字節(jié)了
//再?gòu)?qiáng)調(diào)一下,前提條件是輸入合法的GBK字符串
if(*str > 0x80)
{
// 漢字,計(jì)數(shù)器++
str += 2;//是漢字自然就該直接+2了
}
else
{
str++;
}
}

2、

參看下面的字符串轉(zhuǎn)換函數(shù)。

復(fù)制代碼 代碼如下:

/**
* 用getBytes(encoding):返回字符串的一個(gè)byte數(shù)組
* 當(dāng)b[0]為 63時(shí),應(yīng)該是轉(zhuǎn)碼錯(cuò)誤
* A、不亂碼的漢字字符串:
* 1、encoding用GB2312時(shí),每byte是負(fù)數(shù);
* 2、encoding用ISO8859_1時(shí),b[i]全是63。

* B、亂碼的漢字字符串:
* 1、encoding用ISO8859_1時(shí),每byte也是負(fù)數(shù);
* 2、encoding用GB2312時(shí),b[i]大部分是63。
* C、英文字符串
* 1、encoding用ISO8859_1和GB2312時(shí),每byte都大于0;
* 總結(jié):給定一個(gè)字符串,用getBytes("iso8859_1")
* 1、如果b[i]有63,不用轉(zhuǎn)碼; A-2
* 2、如果b[i]全大于0,那么為英文字符串,不用轉(zhuǎn)碼; B-1
* 3、如果b[i]有小于0的,那么已經(jīng)亂碼,要轉(zhuǎn)碼。 C-1
*/
private static String toGb2312(String str) {
if (str == null) return null;
String retStr = str;
byte b[];
try {
b = str.getBytes("ISO8859_1");

for (int i = 0; i < b.length; i++) {
byte b1 = b[i];
if (b1 == 63)
break; //1
else if (b1 > 0)
continue;//2
else if (b1 < 0) { //不可能為0,0為字符串結(jié)束符
retStr = new String(b, "GB2312");
break;
}
}
} catch (UnsupportedEncodingException e) {
// e.printStackTrace();
}
return retStr;
}

3、

復(fù)制代碼 代碼如下:

unsigned char *str = "test測(cè)試test";
int length;
int i;

length = strlen(str);
for (i = 0; i < length - 1; i++)
{
if ( *str >= 0x81 && *str <= 0xFE
&& *(str + 1) >= 0x40 && *(str + 1) <= 0xFE)
{
// 漢字
}
}

unsignedchar*str="test測(cè)試test";//把字符串換成“漢A”試試,結(jié)果為2

有人說(shuō):“一個(gè)GBK漢字要占兩個(gè)char空間(二字節(jié)),而且第一個(gè)字節(jié)里的值是小于0的??梢該?jù)此判斷是否為漢字?!?BR>1、為什么第一個(gè)字節(jié)的值小于0呢?
2、如果僅通過(guò)判斷第一個(gè)字節(jié)如果小于0,則該字節(jié)和下一個(gè)字節(jié)就組成一個(gè)漢字,這種邏輯是否保險(xiǎn)?
3、因?yàn)檫€看到有人說(shuō),GBK編碼的漢字有高位和低位兩位,第一個(gè)是低位吧?需要第一個(gè)字節(jié)在160-254之間,第二個(gè)字節(jié)在64-254之間,這樣是不是比2中提到的方法要保險(xiǎn)?
4、如果DB中的字符集是SIMPLIFIED CHINESE_CHINA.ZHS16GBK,這個(gè)是GBK字符集?GBK兼容GB2312

似乎有些字符集中有些漢字占三個(gè)字節(jié)

“通過(guò)判斷第一個(gè)字節(jié)如果小于0,則該字節(jié)和下一個(gè)字節(jié)就組成一個(gè)漢字”

//GBK漢字內(nèi)碼范圍
//81-A0 ,40-7E 80-FE
//AA-AF ,40-7E 80-A0
//B0-D6 ,40-7E 80-FE
//D7 ,40-7E 80-F9
//D8-F7 ,40-7E 80-FE
//F8-FE ,40-7E 80-A0
例如://81-A0 ,40-7E 80-FE
表示字符的ascii碼要在129-160,64-126,128-254這三個(gè)區(qū)間段內(nèi)

4、
在工作中,遇到要截取字符串在屏幕上顯示出來(lái),因?yàn)樽址畮в袧h字,如果截取不好,會(huì)引起亂碼,寫了下面的函數(shù)

在uclinux下與VC6.0中測(cè)試可以通過(guò)。

view plaincopy to clipboardprint?

復(fù)制代碼 代碼如下:

 /*截取字符串

 name :要截取的字符串

 store:要存儲(chǔ)的字符串

 len:要截取的長(zhǎng)度

 */

 void split_name( char * name , char * store , int len )
 {

     int i= 0 ;

     char strTemp[L(NAMEL)]={0};

     if ( strlen(name)
     {

         strcpy( store, name );  *name=0;

         return ;

     }

     //從第1個(gè)字節(jié)開始判斷

     while( i < len )

     {

         if ( name[i]>>7&1 && name[i+1]>>7&1 )       //if ( name[i] < 0 && name[i+1] < 0 )

             i = i + 2 ;

         else

             i = i + 1 ;

     }

     i = i > len ? i-3 :i-1;

     strncpy( store , name , i+1 ); //截取前i+1位

     *(store+i+1)=0;

     strcpy( strTemp , name + i + 1 );

     strcpy( name , strTemp );

 }

相關(guān)文章

  • 詳解CLion配置openMP的方法

    詳解CLion配置openMP的方法

    這篇文章主要介紹了CLion配置openMP的方法,本文給大家介紹的非常詳細(xì),對(duì)大家的學(xué)習(xí)或工作具有一定的參考借鑒價(jià)值,需要的朋友可以參考下
    2021-02-02
  • C++ OpenCV生成蒙太奇圖像的示例詳解

    C++ OpenCV生成蒙太奇圖像的示例詳解

    圖片的蒙太奇效果,一般稱為馬賽克圖。由很多小圖拼接成一個(gè)大圖。這篇文章主要為大家介紹如何利用C++ OpenCV實(shí)現(xiàn)生成蒙太奇圖像,感興趣的可以了解一下
    2022-01-01
  • C++中可正確獲取UTF-8字符長(zhǎng)度的函數(shù)分享

    C++中可正確獲取UTF-8字符長(zhǎng)度的函數(shù)分享

    這篇文章主要介紹了C++中可正確獲取UTF-8字符長(zhǎng)度的函數(shù)分享,需要的朋友可以參考下
    2014-08-08
  • 使用mmap實(shí)現(xiàn)多進(jìn)程對(duì)大文件拷貝

    使用mmap實(shí)現(xiàn)多進(jìn)程對(duì)大文件拷貝

    這篇文章主要介紹了使用mmap實(shí)現(xiàn)多進(jìn)程對(duì)大文件拷貝,文中示例代碼介紹的非常詳細(xì),具有一定的參考價(jià)值,感興趣的小伙伴們可以參考一下
    2019-10-10
  • C++ 頭文件系列(set)詳解

    C++ 頭文件系列(set)詳解

    一般而言,每個(gè)C++/C程序通常由頭文件和定義文件組成。頭文件作為一種包含功能函數(shù)、數(shù)據(jù)接口聲明的載體文件,主要用于保存程序的聲明,而定義文件用于保存程序的實(shí)現(xiàn) 。
    2017-02-02
  • C語(yǔ)言基礎(chǔ)之C語(yǔ)言格式化輸出函數(shù)printf詳解

    C語(yǔ)言基礎(chǔ)之C語(yǔ)言格式化輸出函數(shù)printf詳解

    這篇文章主要介紹了C語(yǔ)言格式化輸出函數(shù)printf詳解,printf函數(shù)中用到的格式字符與printf函數(shù)中用到的格式修飾符,感興趣的小伙伴可以借鑒一下
    2023-03-03
  • 深入理解c++中virtual關(guān)鍵字

    深入理解c++中virtual關(guān)鍵字

    本篇文章主要是對(duì)c++中virtual關(guān)鍵字進(jìn)行了詳細(xì)的介紹,需要的朋友可以過(guò)來(lái)參考下,希望對(duì)大家有所幫助
    2014-02-02
  • 從匯編看c++中引用與指針的使用分析

    從匯編看c++中引用與指針的使用分析

    在c++中,引用和指針具有相同的作用,都可以用來(lái)在函數(shù)里面給變函數(shù)外面對(duì)象或者變量的值,下面就來(lái)看他們的原理
    2013-05-05
  • C++中繼承(inheritance)詳解及其作用介紹

    C++中繼承(inheritance)詳解及其作用介紹

    這篇文章主要介紹了C++中繼承(inheritance)詳解及其作用介紹,本文給大家介紹的非常詳細(xì),對(duì)大家的學(xué)習(xí)或工作具有一定的參考借鑒價(jià)值,需要的朋友可以參考下
    2021-09-09
  • 關(guān)于C++中構(gòu)造函數(shù)初始化成員列表的總結(jié)

    關(guān)于C++中構(gòu)造函數(shù)初始化成員列表的總結(jié)

    下面小編就為大家?guī)?lái)一篇關(guān)于C++中構(gòu)造函數(shù)初始化成員列表的總結(jié)。小編覺得挺不錯(cuò)的,現(xiàn)在就分享給大家,也給大家做個(gè)參考。一起跟隨小編過(guò)來(lái)看看吧
    2016-12-12

最新評(píng)論