欧美bbbwbbbw肥妇,免费乱码人妻系列日韩,一级黄片

C#中字符串編碼處理

 更新時間:2013年03月08日 15:07:55   作者:  
C#中字符串編碼處理,需要的朋友可以參考一下

GB2312是簡體中文系統(tǒng)的標準編碼 用“區(qū)” 跟“位”的概念表示 稱之為區(qū)位碼
區(qū)指代大的范圍 位相當于偏移量。
每個漢字占兩個字節(jié)
高位字節(jié)”的范圍是0xB0-0xF7,“低位字節(jié)”的范圍是0xA1-0xFE。
它的規(guī)律好像是按拼音a到z的順序排列的
“啊”字是GB2312之中的第一個漢字,它的區(qū)位碼就是1601
為此我們現(xiàn)在用代碼的方式輸出一個漢字
c#下是little字節(jié)序 b0跑后面去了。

復制代碼 代碼如下:

 ushort u = 0xa1b0;
 byte[] chs =BitConverter.GetBytes(u);
 Console.Write(Encoding.GetEncoding("GB2312").GetString(chs));

屏幕上輸出的是漢字“啊”
但是注意并不代表 寫個循環(huán)從0xbA1 到0xf7fe就可以輸出所有的漢字,這個很簡單比如高位從1到9 低位從1到9 只有81種組合。
并不代表99-11就是結(jié)果 這么二的問題 暈。實際上通過這種方式漢字的個數(shù)總共是6768個,理解了區(qū)位碼的概念后你就知道怎樣去處理gb2312的漢字編碼了。
下面我們就用這種方式來輸出所有的漢字

復制代碼 代碼如下:

//gb2312
 //B0-F7,低字節(jié)從A1-FE
 //byte hi = 0xB0;
 //byte lo = 0xA1;
 for (byte i = 0xB0; i <= 0xF7; i++)
 {
     for (byte j = 0xA1; j <= 0xFE; j++)
     {
         //byte t = (byte)(j | (byte)0x01);
         Console.Write(Encoding.GetEncoding("GB2312").GetString(new byte[] { i, j }));
     }
 }

關(guān)于GB2312的解釋:http://www.dbjr.com.cn/article/34630.htm

ASCII是美國信息交換標準碼 他是從0~127,一個字節(jié)8位最高是255 就是說一個字節(jié)都用不完。
GB2312里也有字母 稱之為全角字符  ,gb2312里也包括ascii碼稱之為半角字符。
全角字符看上去怪怪的 感覺有點不一樣 就像這樣 全角: A半角:A  全角:a 半角:a
全角字符除了在文字系統(tǒng)里用到?jīng)]什么實際作用。
全角字符的第一個字節(jié)總是被置為163,而第二個字節(jié)則是相同半角字符碼加上128(不包括空格)。
如半角A為65,則全角A則是163(第一個字節(jié))、193(第二個字節(jié),128+65)。
知道這個規(guī)律 那么我們也可以遍歷處所有ascii對應的全角字符:

復制代碼 代碼如下:

/**
  *實際上,全角字符的第一個字節(jié)總是被置為163,
  *而第二個字節(jié)則是相同半角字符碼加上128(不包括空格)。
  *如半角A為65,則全角A則是163(第一個字節(jié))、193(第二個字節(jié),128+65)。
  */
 for (byte k = 0x00; k < 0x7f; k++)
 {
     byte[] ch = new byte[2];
     ch[0] = 163;
     ch[1] = (byte)(128 + k);
     Console.Write(Encoding.GetEncoding("GB2312").GetString(ch));
 }

winXp下文本文件默認的保存編碼是ansi ,注意 這個ansi 他的概念跟GB2312又有不同,除此之外還有unicode 、utf-8
他們之間的關(guān)系是:
不同的國家和地區(qū)制定了不同的標準,由此產(chǎn)生了 GB2312, BIG5, JIS 等各自的編碼標準。
這些使用 2 個字節(jié)來代表一個字符的各種漢字延伸編碼方式,稱為 ANSI 編碼。
在簡體中文系統(tǒng)下,ANSI 編碼代表 GB2312 編碼,在日文操作系統(tǒng)下,ANSI 編碼代表 JIS 編碼
C#進行文本讀取時新同學最容易出現(xiàn)不理解為什么文本文件讀取時是亂碼

復制代碼 代碼如下:

 StreamReader sr = new StreamReader(Application.StartupPath + @"\config.txt");
 string line;
 while ((line = sr.ReadLine()) != null)
 {
     Console.WriteLine(line);
 }

因為讀取的方式 也就是解碼的方式跟文本存儲時不一樣,所以初始化streamReader時最好指定編碼,Default即ANSI
復制代碼 代碼如下:

 StreamReader sr = new StreamReader(Application.StartupPath + @"\config.txt", System.Text.Encoding.Default);

相關(guān)文章

  • C#實現(xiàn)Array添加擴展實例

    C#實現(xiàn)Array添加擴展實例

    這篇文章主要介紹了C#實現(xiàn)Array添加擴展,對C#初學者有不錯的參考價值,需要的朋友可以參考下
    2014-08-08
  • C#/.Net開發(fā)chatGPT、openAI的簡單步驟

    C#/.Net開發(fā)chatGPT、openAI的簡單步驟

    OpenAI處于科技行業(yè)下一件大事件的最前沿,具有初創(chuàng)公司史詩般的標志,下面這篇文章主要給大家介紹了關(guān)于C#/.Net開發(fā)chatGPT和openAI的相關(guān)資料,需要的朋友可以參考下
    2023-02-02
  • Unity UGUI的RectMask2D遮罩組件的介紹使用

    Unity UGUI的RectMask2D遮罩組件的介紹使用

    這篇文章主要為大家介紹了Unity UGUI的RectMask2D遮罩組件的介紹使用詳解,有需要的朋友可以借鑒參考下,希望能夠有所幫助,祝大家多多進步,早日升職加薪
    2023-07-07
  • C#入門學習之集合、比較和轉(zhuǎn)換

    C#入門學習之集合、比較和轉(zhuǎn)換

    本文詳細講解了C#中的集合、比較和轉(zhuǎn)換,文中通過示例代碼介紹的非常詳細。對大家的學習或工作具有一定的參考借鑒價值,需要的朋友可以參考下
    2022-05-05
  • C#線程池操作方法

    C#線程池操作方法

    這篇文章主要介紹了C#線程池操作方法,實例分析了C#中線程池的相關(guān)使用技巧,需要的朋友可以參考下
    2015-04-04
  • 基于C#對用戶密碼使用MD5加密與解密

    基于C#對用戶密碼使用MD5加密與解密

    C#中常涉及到對用戶密碼的加密于解密的算法,其中使用MD5加密是最常見的的實現(xiàn)方式。本文總結(jié)了通用的算法并結(jié)合了自己的一點小經(jīng)驗,分享給大家
    2015-12-12
  • C#異步編程的三種模式

    C#異步編程的三種模式

    本文詳細講解了C#異步編程的三種模式,文中通過示例代碼介紹的非常詳細。對大家的學習或工作具有一定的參考借鑒價值,需要的朋友可以參考下
    2022-04-04
  • C#使用timer定時在屏幕上輸出信息的方法

    C#使用timer定時在屏幕上輸出信息的方法

    這篇文章主要介紹了C#使用timer定時在屏幕上輸出信息的方法,涉及C#中timer定時器的使用技巧,具有一定參考借鑒價值,需要的朋友可以參考下
    2015-03-03
  • Unity實現(xiàn)簡單虛擬搖桿

    Unity實現(xiàn)簡單虛擬搖桿

    這篇文章主要為大家詳細介紹了Unity實現(xiàn)簡單虛擬搖桿,文中示例代碼介紹的非常詳細,具有一定的參考價值,感興趣的小伙伴們可以參考一下
    2020-04-04
  • 解析Silverlight調(diào)用WCF/Rest異常的解決方法

    解析Silverlight調(diào)用WCF/Rest異常的解決方法

    本篇文章對Silverlight調(diào)用WCF/Rest異常的解決方法進行了詳細的分析介紹,需要的朋友參考下
    2013-05-05

最新評論