php自動獲取字符串編碼函數(shù)mb_detect_encoding
更新時間:2011年05月31日 13:45:21 作者:
使用 mb_detect_encoding() 函數(shù)來判斷字符串是什么編碼的。
當在php中使用mb_detect_encoding函數(shù)進行編碼識別時,很多人都碰到過識別編碼有誤的問題,例如對與GB2312和UTF- 8,或者UTF-8和GBK(這里主要是對于cp936的判斷),網(wǎng)上說是由于字符短是,mb_detect_encoding會出現(xiàn)誤判。
例如:
復制代碼 代碼如下:
$encode = mb_detect_encoding($keytitle, array("ASCII",'UTF-8′,"GB2312′,"GBK",'BIG5′));
if ($encode == “UTF-8″){
$keytitle = iconv("UTF-8″,"GBK",$keytitle);
}
這段代碼的作用是檢測字符串的編碼是否UTF-8,是的話就轉(zhuǎn)換為GBK。
可是當 $keytitle = “%D0%BE%C6%AC”;時。檢測結(jié)果卻是UTF-8.這個bug其實不算是bug,寫程序時也不應當過于依賴mb_detect_encoding,當字符串較短時,檢測結(jié)果產(chǎn)生偏差的可能性很大。
怎么解決呢,我的辦法是:
復制代碼 代碼如下:
$encode = mb_detect_encoding($keytitle, array('ASCII','GB2312′,'GBK','UTF-8');
三個參數(shù)分別是:被檢測的輸入變量、編碼方式的檢測順序(一旦為真,后面自動忽略)、strict模式
對編碼檢測的順序進行調(diào)整,將最大可能性放在前面,這樣減少被錯誤轉(zhuǎn)換的機會。
一般要先排gb2312,當有GBK和UTF-8時,需要將常用的排列到前面。
您可能感興趣的文章:
相關文章
PHP5.4中json_encode中文轉(zhuǎn)碼的變化小結(jié)
在php5.4以前做json_encode的時候中文會被unicode編碼,中文都會被編碼,變成不可讀的,類似“\u***”的格式,接下來介紹幾種5.4之前不進行unicode轉(zhuǎn)碼的處理方法2013-01-01PHP中檢索字符串的方法分析【strstr與substr_count方法】
這篇文章主要介紹了PHP中檢索字符串的方法,結(jié)合實例形式分析了strstr與substr_count函數(shù)的功能與具體使用技巧,需要的朋友可以參考下2017-02-02PHP遞歸遍歷指定目錄的文件并統(tǒng)計文件數(shù)量的方法
這篇文章主要介紹了PHP遞歸遍歷指定目錄的文件并統(tǒng)計文件數(shù)量的方法,涉及php文件及目錄操作的技巧,非常具有實用價值,需要的朋友可以參考下2015-03-03PHP連接MSSQL時nvarchar字段長度被截斷為255的解決方法
這篇文章主要介紹了PHP連接MSSQL時nvarchar字段長度被截斷為255的解決方法,可通過CAST數(shù)據(jù)類型轉(zhuǎn)換來解決,是非常實用的技巧,需要的朋友可以參考下2014-12-12php使用ob_start()實現(xiàn)圖片存入變量的方法
這篇文章主要介紹了php使用ob_start()實現(xiàn)圖片存入變量的方法,是對緩存的靈活運用,具有既定的參考借鑒價值,需要的朋友可以參考下2014-11-11