PHP 正則判斷中文UTF-8或GBK的思路及具體實現(xiàn)
更新時間:2013年11月26日 17:58:37 作者:
UTF-8匹配: 在javascript中,要判斷字符串是中文是很簡單的,下面有個不錯的判斷示例,需要的朋友可以參考下
UTF-8匹配: 在javascript中,要判斷字符串是中文是很簡單的。比如:
var str = "php編程";
if (/^[\u4e00-\u9fa5]+$/.test(str)) {
alert("該字符串全部是中文");
}else{
alert("該字符串不全部是中文");
}
//php中,是用\x表示十六進(jìn)制數(shù)據(jù)的。于是,變換成如下的代碼:
$str = "php編程";
if (preg_match("/^[\x4e00-\x9fa5]+$/",$str)) {
print("該字符串全部是中文");
} else {
print("該字符串不全部是中文");
}
貌似不報錯了,判斷的結(jié)果也正確,不過把$str換成“編程”兩字,結(jié)果卻還是顯示“該字符串不全部是中文”,看來這樣的判斷還是不夠準(zhǔn)確。重要:查閱了<精通正則表達(dá)式>發(fā)現(xiàn),對于[\x4e00-\x9fa5]這塊東西,自己做一個強(qiáng)化的解釋 php的正則中, [\x4e00-\x9fa5],其實就是 字符和字符組的概念, \x{hex},表達(dá)一個16進(jìn)制數(shù), 需要注意的是hex 可以是1-2位的,也可以是4位的,但是如果是4位的必須加上大括號, 同時,如果是大于x{FF}的hex,必須和u 修飾符連用,不然會非法出錯
網(wǎng)上只能找到匹配全角字符的正則: ^[\x80-\xff]*^/ ,這里可以不加大括號
[\u4e00-\u9fa5]可以匹配中文,但是PHP又不支持
不過,既然\x表示的十六進(jìn)制數(shù)據(jù),為什么和js里邊提供的范圍\x4e00-\x9fa5不一樣呢?于是我就換成了下邊的代碼,發(fā)現(xiàn)真的準(zhǔn)確了:
$str = "php編程";
if (preg_match("/^[\x{4e00}-\x{9fa5}]+$/u",$str)) {
print("該字符串全部是中文");
} else {
print("該字符串不全部是中文");
}
知道了php中utf-8編碼下用正則表達(dá)式匹配漢字的最終正確表達(dá)式——/^[\x{4e00}-\x{9fa5}]+$/u,
參考以上文章寫了如下一段測試代碼(復(fù)制以下代碼保存成.php文件)
<?php
$action = trim($_GET['action']);
if($action == "sub")
{
$str = $_POST['dir'];
//if(!preg_match("/^[".chr(0xa1)."-".chr(0xff)."A-Za-z0-9_]+$/",$str)) //GB2312漢字字母數(shù)字下劃線正則表達(dá)式
if(!preg_match("/^[\x{4e00}-\x{9fa5}A-Za-z0-9_]+$/u",$str)) //UTF-8漢字字母數(shù)字下劃線正則表達(dá)式
{
echo "<font color=red>您輸入的[".$str."]含有違法字符</font>";
}
else
{
echo "<font color=green>您輸入的[".$str."]完全合法,通過!</font>";
}
}
?>
<form. method="POST" action="?action=sub">
輸入字符(數(shù)字,字母,漢字,下劃線):
<input type="text" name="dir" value="">
<input type="submit" value="提交">
</form>
GBK: preg_match("/^[".chr(0xa1)."-".chr(0xff)."A-Za-z0-9_]+$/",$str); //GB2312漢字字母數(shù)字下劃線正則表達(dá)式。
復(fù)制代碼 代碼如下:
var str = "php編程";
if (/^[\u4e00-\u9fa5]+$/.test(str)) {
alert("該字符串全部是中文");
}else{
alert("該字符串不全部是中文");
}
//php中,是用\x表示十六進(jìn)制數(shù)據(jù)的。于是,變換成如下的代碼:
$str = "php編程";
if (preg_match("/^[\x4e00-\x9fa5]+$/",$str)) {
print("該字符串全部是中文");
} else {
print("該字符串不全部是中文");
}
貌似不報錯了,判斷的結(jié)果也正確,不過把$str換成“編程”兩字,結(jié)果卻還是顯示“該字符串不全部是中文”,看來這樣的判斷還是不夠準(zhǔn)確。重要:查閱了<精通正則表達(dá)式>發(fā)現(xiàn),對于[\x4e00-\x9fa5]這塊東西,自己做一個強(qiáng)化的解釋 php的正則中, [\x4e00-\x9fa5],其實就是 字符和字符組的概念, \x{hex},表達(dá)一個16進(jìn)制數(shù), 需要注意的是hex 可以是1-2位的,也可以是4位的,但是如果是4位的必須加上大括號, 同時,如果是大于x{FF}的hex,必須和u 修飾符連用,不然會非法出錯
網(wǎng)上只能找到匹配全角字符的正則: ^[\x80-\xff]*^/ ,這里可以不加大括號
[\u4e00-\u9fa5]可以匹配中文,但是PHP又不支持
不過,既然\x表示的十六進(jìn)制數(shù)據(jù),為什么和js里邊提供的范圍\x4e00-\x9fa5不一樣呢?于是我就換成了下邊的代碼,發(fā)現(xiàn)真的準(zhǔn)確了:
復(fù)制代碼 代碼如下:
$str = "php編程";
if (preg_match("/^[\x{4e00}-\x{9fa5}]+$/u",$str)) {
print("該字符串全部是中文");
} else {
print("該字符串不全部是中文");
}
知道了php中utf-8編碼下用正則表達(dá)式匹配漢字的最終正確表達(dá)式——/^[\x{4e00}-\x{9fa5}]+$/u,
參考以上文章寫了如下一段測試代碼(復(fù)制以下代碼保存成.php文件)
復(fù)制代碼 代碼如下:
<?php
$action = trim($_GET['action']);
if($action == "sub")
{
$str = $_POST['dir'];
//if(!preg_match("/^[".chr(0xa1)."-".chr(0xff)."A-Za-z0-9_]+$/",$str)) //GB2312漢字字母數(shù)字下劃線正則表達(dá)式
if(!preg_match("/^[\x{4e00}-\x{9fa5}A-Za-z0-9_]+$/u",$str)) //UTF-8漢字字母數(shù)字下劃線正則表達(dá)式
{
echo "<font color=red>您輸入的[".$str."]含有違法字符</font>";
}
else
{
echo "<font color=green>您輸入的[".$str."]完全合法,通過!</font>";
}
}
?>
復(fù)制代碼 代碼如下:
<form. method="POST" action="?action=sub">
輸入字符(數(shù)字,字母,漢字,下劃線):
<input type="text" name="dir" value="">
<input type="submit" value="提交">
</form>
GBK: preg_match("/^[".chr(0xa1)."-".chr(0xff)."A-Za-z0-9_]+$/",$str); //GB2312漢字字母數(shù)字下劃線正則表達(dá)式。
相關(guān)文章
php 遍歷數(shù)據(jù)表數(shù)據(jù)并列表橫向排列的代碼
下面是個例子:表格橫向排列例子2009-09-09php自定義排序uasort函數(shù)示例【二維數(shù)組按指定鍵值排序】
這篇文章主要介紹了php自定義排序uasort函數(shù),結(jié)合實例形式分析了php實現(xiàn)二維數(shù)組按指定鍵值排序的相關(guān)操作技巧,需要的朋友可以參考下2019-06-06WordPress開發(fā)中的get_post_custom()函數(shù)使用解析
這篇文章主要介紹了WordPress開發(fā)中的get_post_custom()函數(shù)使用解析,get_post_custom()函數(shù)用于獲取自定義字段,需要的朋友可以參考下2016-01-01php自定義函數(shù)br2nl實現(xiàn)將html中br換行符轉(zhuǎn)換為文本輸入中換行符的方法【與函數(shù)nl2br功能相反】
這篇文章主要介紹了php自定義函數(shù)br2nl實現(xiàn)將html中br換行符轉(zhuǎn)換為文本輸入中換行符的方法,具有與函數(shù)nl2br相反的功能,并附帶了相應(yīng)的JS實現(xiàn)方法,需要的朋友可以參考下2017-02-02PHP使用array_merge重新排列數(shù)組下標(biāo)的方法
這篇文章主要介紹了PHP使用array_merge重新排列數(shù)組下標(biāo)的方法,以實例形式較為詳細(xì)的分析了array_merge的功能,及針對數(shù)組下標(biāo)進(jìn)行重新排列操作的實現(xiàn)技巧,需要的朋友可以參考下2015-07-07