PHP UTF8中文字符截斷函數(shù)代碼
更新時間:2012年09月11日 01:43:49 作者:
今天需要用一個UTF-8的字符串截斷函數(shù),網(wǎng)上找了幾個代碼片段發(fā)現(xiàn)都有問題,于是查了一下原理自己寫了一個函數(shù),代碼片段如下
php中英文混合字符截斷不亂碼函數(shù)(utf8)
復(fù)制代碼 代碼如下:
//utf8格式下的中文字符截斷
//$sourcestr 是要處理的字符串
//$cutlength 為截取的長度(即字?jǐn)?shù))
//$addstr 超過長度時在尾處加上的字符
function cut_str($sourcestr, $cutlength, $addstr='...'){
$returnstr='';
$i=0;
$n=0;
$str_length=strlen($sourcestr);//字符串的字節(jié)數(shù)
while (($n<$cutlength) and ($i<=$str_length)){
$temp_str=substr($sourcestr,$i,1);
$ascnum=Ord($temp_str);//得到字符串中第$i位字符的ascii碼
if ($ascnum>=224){ //如果ASCII位高與224,
$returnstr=$returnstr.substr($sourcestr,$i,3); //根據(jù)UTF-8編碼規(guī)范,將3個連續(xù)的字符計為單個字符
$i=$i+3; //實際Byte計為3
$n++; //字串長度計1
}elseif ($ascnum>=192){ //如果ASCII位高與192,
$returnstr=$returnstr.substr($sourcestr,$i,2); //根據(jù)UTF-8編碼規(guī)范,將2個連續(xù)的字符計為單個字符
$i=$i+2; //實際Byte計為2
$n++; //字串長度計1
}elseif ($ascnum>=65 && $ascnum<=90){ //如果是大寫字母,
$returnstr=$returnstr.substr($sourcestr,$i,1);
$i=$i+1; //實際的Byte數(shù)仍計1個
$n++; //但考慮整體美觀,大寫字母計成一個高位字符
}else{ //其他情況下,包括小寫字母和半角標(biāo)點符號,
$returnstr=$returnstr.substr($sourcestr,$i,1);
$i=$i+1; //實際的Byte數(shù)計1個
$n=$n+0.5; //小寫字母和半角標(biāo)點等與半個高位字符寬...
}
}
if ($str_length>$cutlength){
$returnstr = $returnstr . $addstr;//超過長度時在尾處加上的字符
}
return $returnstr;
}
復(fù)制代碼 代碼如下:
<?php
/* UTF-8中文字符截斷程序 */
$str = "123這是測試字符串";
$str1 = "()()";
echo subUTF8str($str,0,3)."<br>";
echo subUTF8str($str,0,4)."<br>";
echo subUTF8str($str1,0,4)."<br>";
echo subUTF8str($str1,0,10)."<br>";
function subUTF8str($str,$start=0,$length=80){
$cur_len = 0; //人理解的字符串長度
$all_len = strlen($str); //機(jī)器理解字符串長度
if($length > $all_len)
{
return $str;
}
for($i = 0;$i < $all_len;)
{
if($cur_len == $start)
{
break;
}
if (ord($str[$i]) > 127)
{
$i += 3;
}else{
$i += 1;
}
$cur_len ++;
}
$start_pos = $i;
$temp_pos = $cur_len;
for(;$cur_len - $temp_pos < $length;)
{
if($i >= $all_len)
break;
if (ord($str[$i]) > 127)
{
$i += 3;
}else{
$i += 1;
}
$cur_len ++;
}
$end_pos = $i;
return substr($str,$start_pos,$end_pos);
}
?>
其實,PHP原生就有多charset下字符截取方案,額,所以就是這個樣子...囧..
Multibyte String Functions函數(shù)族中,
string mb_substr ( string $str , int $start [, int $length [, string $encoding ]] ) 用來字符串截取
int mb_strlen ( string $str [, string $encoding ] ) 返回字符串長度
....
詳細(xì)請查看PHP手冊
相關(guān)文章
THINKPHP+JS實現(xiàn)縮放圖片式截圖的實現(xiàn)
上傳圖片 -- 保存并顯示圖片 -- JS獲取縮略圖參數(shù) -- 提交位置參數(shù) -- 圖片縮放保存類處理圖片 -- 保存截取的圖片--更新數(shù)據(jù)庫 -- 跳轉(zhuǎn)2010-03-03PHP中addslashes()和stripslashes()實現(xiàn)字符串轉(zhuǎn)義和還原用法實例
這篇文章主要介紹了PHP中addslashes()和stripslashes()實現(xiàn)字符串轉(zhuǎn)義和還原用法,結(jié)合實例形式較為詳細(xì)的分析了addslashes()和stripslashes()函數(shù)的功能,定義及具體使用技巧,并附帶說明了addslashes()與addcslashes()函數(shù)的區(qū)別,需要的朋友可以參考下2016-01-01解析php中die(),exit(),return的區(qū)別
本篇文章是對php中die(),exit(),return的區(qū)別進(jìn)行了詳細(xì)的分析介紹,需要的朋友參考下2013-06-06PHP開發(fā)工具ZendStudio下Xdebug工具使用說明詳解
我使用的是XAMPP的集成開發(fā)平臺環(huán)境。里面已經(jīng)預(yù)設(shè)了Xdebug的調(diào)試工具,只需要自己改下配置的就可以了2013-11-11windows7下安裝php的imagick和imagemagick擴(kuò)展教程
這篇文章主要介紹了windows7下安裝php的imagick和imagemagick擴(kuò)展教程,同樣也適應(yīng)XP操作系統(tǒng),Win8下就沒測試過了,需要的朋友可以參考下2014-07-07PHP獲取文件擴(kuò)展名的常用方法小結(jié)【五種方式】
這篇文章主要介紹了PHP獲取文件擴(kuò)展名的常用方法,結(jié)合實例形式總結(jié)分析了php獲取文件擴(kuò)展名的五種常見操作技巧,需要的朋友可以參考下2018-04-04PHP中數(shù)組轉(zhuǎn)換為SimpleXML教程
在本篇文章中我們給大家總結(jié)了一篇關(guān)于PHP中數(shù)組轉(zhuǎn)換為SimpleXML教程內(nèi)容,有需要的朋友們跟著學(xué)習(xí)參考下。2019-01-01