欧美bbbwbbbw肥妇,免费乱码人妻系列日韩,一级黄片

分割GBK中文遭遇亂碼的解決方法

 更新時(shí)間:2013年08月09日 09:05:12   作者:  
以下是對(duì)分割GBK中文遭遇亂碼的解決方法進(jìn)行了詳細(xì)的分析介紹,需要的朋友可以過(guò)來(lái)參考下

類似如下的字符串(GBK), explode不能得到正確結(jié)果:

1.$result = explode("|", "滕華弢|海青"); 究其原因, 對(duì)于”弢”字(讀tao,不認(rèn)識(shí)沒(méi)關(guān)系,我也不認(rèn)識(shí)), 因?yàn)樗腉BK編碼值為: 8f7c, 不巧的是, “|”的ASCII值也是7c.

這樣的問(wèn)題, 還有很多 : 因?yàn)镚BK編碼的編碼范圍是: 0×8140-0xfefe, 所以, 理論上來(lái)說(shuō), 任何低字節(jié)是7c的字都會(huì)有這個(gè)問(wèn)題, 比如:

1.倈(827c), 億(837c), 眧(b17c), 鍇(e57c).......等等等等對(duì)于這樣的情況,

1.第一, 可以采用轉(zhuǎn)碼到utf8, 然后explode, 再轉(zhuǎn)回來(lái), 這是比較麻煩的方法.
2.第二, 我們可以采用正則拿"匹配出"來(lái)代替"分離出":
3.preg_match_all("/([/x81-/xfe][/x40-/xfe])+/", $gbk_str, $matches);//寫(xiě)死編碼這樣, $matches中0號(hào)索引對(duì)應(yīng)的數(shù)組就是結(jié)果詞的數(shù)組了..

相關(guān)文章

最新評(píng)論