PHP獲取中英混合字符串長(zhǎng)度的方法
今晚在寫(xiě)框架的表單驗(yàn)證類時(shí),需要判斷某個(gè)字符串長(zhǎng)度是否在指定區(qū)間內(nèi),很自然地,想到了PHP中的strlen函數(shù)。
$str = 'Hello world!';
echo strlen($str); // 輸出12
然而在PHP自帶的函數(shù)中,strlen及mb_strlen都是通過(guò)計(jì)算字符串所占字節(jié)數(shù)來(lái)計(jì)算長(zhǎng)度的,在不同的編碼情況下,中文所占的字節(jié)數(shù)是不同的。在GBK/GB2312下,中文字符占2個(gè)字節(jié),而在UTF-8下,中文字符占3個(gè)字節(jié)。
$str = '你好,世界!';
echo strlen($str); // GBK或GB2312下輸出12,UTF-8下輸出18
而我們?cè)谂袛嘧址L(zhǎng)度時(shí)往往需要判斷的是字符的數(shù)量,而非字符串所占字節(jié)數(shù),如在UTF-8下的這段PHP代碼:
$name = '張耕暢';
$len = strlen($name);
// 輸出 FALSE,因?yàn)樵赨TF-8下三個(gè)中文占9個(gè)字節(jié)
if($len >= 3 && $len <= 8){
echo 'TRUE';
}else{
echo 'FALSE';
}
那么有什么方便而實(shí)用的方法可以獲得含中文字符串的長(zhǎng)度呢?可以用正則計(jì)算出中文字符的個(gè)數(shù),在GBK/GB2312編碼下除以2,UTF-8編碼下則除以3,最后再加上非中文字符串的長(zhǎng)度,但這樣未免太過(guò)麻煩。
WordPress這么一段代碼,借鑒如下:
$str = 'Hello,世界!';
preg_match_all('/./us', $str, $match);
echo count($match[0]); // 輸出9
思想是用正則表達(dá)式將字符串分割成單個(gè)字符,并直接用count計(jì)算出匹配到的字符數(shù),便是我們想要的結(jié)果了。
但以上代碼在UTF-8編碼下并不能處理GBK/GB2312的中文字符串,因?yàn)镚BK/GB2312的中文字符會(huì)被識(shí)別為兩個(gè)字符而計(jì)算出來(lái)的中文字符數(shù)量會(huì)翻倍,于是我想到了這么一個(gè)辦法:
$tmp = @iconv('gbk', 'utf-8', $str);
if(!empty($tmp)){
$str = $tmp;
}
preg_match_all('/./us', $str, $match);
echo count($match[0]);
可兼容GBK/GB2312及UTF-8編碼,經(jīng)小量數(shù)據(jù)測(cè)試通過(guò),但暫未確定是否完全正確,盼有大牛指點(diǎn)一二。
以上本意是為了框架可以兼容多種編碼格式,但一般在日常開(kāi)發(fā)中,一個(gè)項(xiàng)目是已經(jīng)可以確定為何種編碼的,因此可以使用以下函數(shù)來(lái)方便地獲取字符串長(zhǎng)度:
int iconv_strlen ( string $str [, string $charset = ini_get("iconv.internal_encoding") ] )
- PHP指定截取字符串中的中英文或數(shù)字字符的實(shí)例分享
- 利用PHP函數(shù)計(jì)算中英文字符串長(zhǎng)度的方法
- php輕松實(shí)現(xiàn)中英文混排字符串截取
- php截取字符串之截取utf8或gbk編碼的中英文字符串示例
- 使用php統(tǒng)計(jì)字符串中中英文字符的個(gè)數(shù)
- php strlen mb_strlen計(jì)算中英文混排字符串長(zhǎng)度
- PHP 中英文混合排版中處理字符串常用的函數(shù)
- PHP字符串長(zhǎng)度計(jì)算 - strlen()函數(shù)使用介紹
- php中計(jì)算中文字符串長(zhǎng)度、截取中文字符串的函數(shù)代碼
- PHP 字符串長(zhǎng)度判斷效率更高的方法
- PHP判斷字符串長(zhǎng)度的兩種方法很實(shí)用
- PHP針對(duì)中英文混合字符串長(zhǎng)度判斷及截取方法示例
相關(guān)文章
PHP利用遞歸函數(shù)實(shí)現(xiàn)無(wú)限級(jí)分類的方法
今天小編就為大家分享一篇關(guān)于PHP利用遞歸函數(shù)實(shí)現(xiàn)無(wú)限級(jí)分類的方法,小編覺(jué)得內(nèi)容挺不錯(cuò)的,現(xiàn)在分享給大家,具有很好的參考價(jià)值,需要的朋友一起跟隨小編來(lái)看看吧2019-03-03PHP+Ajax實(shí)現(xiàn)的博客文章添加類別功能示例
這篇文章主要介紹了PHP+Ajax實(shí)現(xiàn)的博客文章添加類別功能,結(jié)合實(shí)例形式分析了php+ajax實(shí)現(xiàn)的數(shù)據(jù)交互、數(shù)據(jù)庫(kù)連接、查詢等相關(guān)操作技巧,需要的朋友可以參考下2018-03-03解析PHP計(jì)算頁(yè)面執(zhí)行時(shí)間的實(shí)現(xiàn)代碼
本篇文章是對(duì)PHP計(jì)算頁(yè)面執(zhí)行時(shí)間的實(shí)現(xiàn)代碼進(jìn)行了詳細(xì)的分析介紹,需要的朋友參考下2013-06-06PHP API接口必備之輸出json格式數(shù)據(jù)示例代碼
這篇文章主要給大家介紹了關(guān)于PHP API接口必備之輸出json格式數(shù)據(jù)的相關(guān)資料文中通過(guò)示例代碼介紹的非常詳細(xì),對(duì)大家具有一定的參考學(xué)習(xí)價(jià)值,需要的朋友們下面來(lái)一起看看吧。2017-06-06PHP簡(jiǎn)單實(shí)現(xiàn)文本計(jì)數(shù)器的方法
這篇文章主要介紹了PHP簡(jiǎn)單實(shí)現(xiàn)文本計(jì)數(shù)器的方法,涉及PHP針對(duì)文本文件的簡(jiǎn)單判斷,讀取及寫(xiě)入等操作技巧,需要的朋友可以參考下2016-04-04PHP code 驗(yàn)證碼生成類定義和簡(jiǎn)單使用示例
這篇文章主要介紹了PHP code 驗(yàn)證碼生成類定義和簡(jiǎn)單使用,結(jié)合實(shí)例形式分析了PHP code 驗(yàn)證碼生成類的基本功能定義、簡(jiǎn)單使用方法及操作注意事項(xiàng),需要的朋友可以參考下2020-05-05淺析HTTP消息頭網(wǎng)頁(yè)緩存控制以及header常用指令介紹
本篇文章是對(duì)HTTP消息頭網(wǎng)頁(yè)緩存控制以及header常用指令進(jìn)行了詳細(xì)的分析介紹,需要的朋友參考下2013-06-06