PHP 正則判斷中文UTF-8或GBK的思路及具體實(shí)現(xiàn)
更新時(shí)間:2013年11月26日 17:58:37 作者:
UTF-8匹配: 在javascript中,要判斷字符串是中文是很簡(jiǎn)單的,下面有個(gè)不錯(cuò)的判斷示例,需要的朋友可以參考下
UTF-8匹配: 在javascript中,要判斷字符串是中文是很簡(jiǎn)單的。比如:
var str = "php編程";
if (/^[\u4e00-\u9fa5]+$/.test(str)) {
alert("該字符串全部是中文");
}else{
alert("該字符串不全部是中文");
}
//php中,是用\x表示十六進(jìn)制數(shù)據(jù)的。于是,變換成如下的代碼:
$str = "php編程";
if (preg_match("/^[\x4e00-\x9fa5]+$/",$str)) {
print("該字符串全部是中文");
} else {
print("該字符串不全部是中文");
}
貌似不報(bào)錯(cuò)了,判斷的結(jié)果也正確,不過把$str換成“編程”兩字,結(jié)果卻還是顯示“該字符串不全部是中文”,看來這樣的判斷還是不夠準(zhǔn)確。重要:查閱了<精通正則表達(dá)式>發(fā)現(xiàn),對(duì)于[\x4e00-\x9fa5]這塊東西,自己做一個(gè)強(qiáng)化的解釋 php的正則中, [\x4e00-\x9fa5],其實(shí)就是 字符和字符組的概念, \x{hex},表達(dá)一個(gè)16進(jìn)制數(shù), 需要注意的是hex 可以是1-2位的,也可以是4位的,但是如果是4位的必須加上大括號(hào), 同時(shí),如果是大于x{FF}的hex,必須和u 修飾符連用,不然會(huì)非法出錯(cuò)
網(wǎng)上只能找到匹配全角字符的正則: ^[\x80-\xff]*^/ ,這里可以不加大括號(hào)
[\u4e00-\u9fa5]可以匹配中文,但是PHP又不支持
不過,既然\x表示的十六進(jìn)制數(shù)據(jù),為什么和js里邊提供的范圍\x4e00-\x9fa5不一樣呢?于是我就換成了下邊的代碼,發(fā)現(xiàn)真的準(zhǔn)確了:
$str = "php編程";
if (preg_match("/^[\x{4e00}-\x{9fa5}]+$/u",$str)) {
print("該字符串全部是中文");
} else {
print("該字符串不全部是中文");
}
知道了php中utf-8編碼下用正則表達(dá)式匹配漢字的最終正確表達(dá)式——/^[\x{4e00}-\x{9fa5}]+$/u,
參考以上文章寫了如下一段測(cè)試代碼(復(fù)制以下代碼保存成.php文件)
<?php
$action = trim($_GET['action']);
if($action == "sub")
{
$str = $_POST['dir'];
//if(!preg_match("/^[".chr(0xa1)."-".chr(0xff)."A-Za-z0-9_]+$/",$str)) //GB2312漢字字母數(shù)字下劃線正則表達(dá)式
if(!preg_match("/^[\x{4e00}-\x{9fa5}A-Za-z0-9_]+$/u",$str)) //UTF-8漢字字母數(shù)字下劃線正則表達(dá)式
{
echo "<font color=red>您輸入的[".$str."]含有違法字符</font>";
}
else
{
echo "<font color=green>您輸入的[".$str."]完全合法,通過!</font>";
}
}
?>
<form. method="POST" action="?action=sub">
輸入字符(數(shù)字,字母,漢字,下劃線):
<input type="text" name="dir" value="">
<input type="submit" value="提交">
</form>
GBK: preg_match("/^[".chr(0xa1)."-".chr(0xff)."A-Za-z0-9_]+$/",$str); //GB2312漢字字母數(shù)字下劃線正則表達(dá)式。
復(fù)制代碼 代碼如下:
var str = "php編程";
if (/^[\u4e00-\u9fa5]+$/.test(str)) {
alert("該字符串全部是中文");
}else{
alert("該字符串不全部是中文");
}
//php中,是用\x表示十六進(jìn)制數(shù)據(jù)的。于是,變換成如下的代碼:
$str = "php編程";
if (preg_match("/^[\x4e00-\x9fa5]+$/",$str)) {
print("該字符串全部是中文");
} else {
print("該字符串不全部是中文");
}
貌似不報(bào)錯(cuò)了,判斷的結(jié)果也正確,不過把$str換成“編程”兩字,結(jié)果卻還是顯示“該字符串不全部是中文”,看來這樣的判斷還是不夠準(zhǔn)確。重要:查閱了<精通正則表達(dá)式>發(fā)現(xiàn),對(duì)于[\x4e00-\x9fa5]這塊東西,自己做一個(gè)強(qiáng)化的解釋 php的正則中, [\x4e00-\x9fa5],其實(shí)就是 字符和字符組的概念, \x{hex},表達(dá)一個(gè)16進(jìn)制數(shù), 需要注意的是hex 可以是1-2位的,也可以是4位的,但是如果是4位的必須加上大括號(hào), 同時(shí),如果是大于x{FF}的hex,必須和u 修飾符連用,不然會(huì)非法出錯(cuò)
網(wǎng)上只能找到匹配全角字符的正則: ^[\x80-\xff]*^/ ,這里可以不加大括號(hào)
[\u4e00-\u9fa5]可以匹配中文,但是PHP又不支持
不過,既然\x表示的十六進(jìn)制數(shù)據(jù),為什么和js里邊提供的范圍\x4e00-\x9fa5不一樣呢?于是我就換成了下邊的代碼,發(fā)現(xiàn)真的準(zhǔn)確了:
復(fù)制代碼 代碼如下:
$str = "php編程";
if (preg_match("/^[\x{4e00}-\x{9fa5}]+$/u",$str)) {
print("該字符串全部是中文");
} else {
print("該字符串不全部是中文");
}
知道了php中utf-8編碼下用正則表達(dá)式匹配漢字的最終正確表達(dá)式——/^[\x{4e00}-\x{9fa5}]+$/u,
參考以上文章寫了如下一段測(cè)試代碼(復(fù)制以下代碼保存成.php文件)
復(fù)制代碼 代碼如下:
<?php
$action = trim($_GET['action']);
if($action == "sub")
{
$str = $_POST['dir'];
//if(!preg_match("/^[".chr(0xa1)."-".chr(0xff)."A-Za-z0-9_]+$/",$str)) //GB2312漢字字母數(shù)字下劃線正則表達(dá)式
if(!preg_match("/^[\x{4e00}-\x{9fa5}A-Za-z0-9_]+$/u",$str)) //UTF-8漢字字母數(shù)字下劃線正則表達(dá)式
{
echo "<font color=red>您輸入的[".$str."]含有違法字符</font>";
}
else
{
echo "<font color=green>您輸入的[".$str."]完全合法,通過!</font>";
}
}
?>
復(fù)制代碼 代碼如下:
<form. method="POST" action="?action=sub">
輸入字符(數(shù)字,字母,漢字,下劃線):
<input type="text" name="dir" value="">
<input type="submit" value="提交">
</form>
GBK: preg_match("/^[".chr(0xa1)."-".chr(0xff)."A-Za-z0-9_]+$/",$str); //GB2312漢字字母數(shù)字下劃線正則表達(dá)式。
您可能感興趣的文章:
- php用正則判斷是否為數(shù)字的方法
- php不用正則驗(yàn)證真假身份證
- PHP 驗(yàn)證身份證是否合法的函數(shù)
- php從身份證獲取性別和出生年月
- php驗(yàn)證身份證號(hào)碼正確性的函數(shù)
- 使用php從身份證號(hào)中獲取一系列線索(星座、生肖、生日等)
- php提取身份證號(hào)碼中的生日日期以及驗(yàn)證是否為成年人的函數(shù)
- php身份證號(hào)碼檢查類實(shí)例
- PHP用星號(hào)隱藏部份用戶名、身份證、IP、手機(jī)號(hào)等實(shí)例
- Ajax和PHP正則表達(dá)式驗(yàn)證表單及驗(yàn)證碼
- php正則表達(dá)式驗(yàn)證(郵件地址、Url地址、電話號(hào)碼、郵政編碼)
- php正則判斷是否為合法身份證號(hào)的方法
相關(guān)文章
php 遍歷數(shù)據(jù)表數(shù)據(jù)并列表橫向排列的代碼
下面是個(gè)例子:表格橫向排列例子2009-09-09php自定義排序uasort函數(shù)示例【二維數(shù)組按指定鍵值排序】
這篇文章主要介紹了php自定義排序uasort函數(shù),結(jié)合實(shí)例形式分析了php實(shí)現(xiàn)二維數(shù)組按指定鍵值排序的相關(guān)操作技巧,需要的朋友可以參考下2019-06-06WordPress開發(fā)中的get_post_custom()函數(shù)使用解析
這篇文章主要介紹了WordPress開發(fā)中的get_post_custom()函數(shù)使用解析,get_post_custom()函數(shù)用于獲取自定義字段,需要的朋友可以參考下2016-01-01php自定義函數(shù)br2nl實(shí)現(xiàn)將html中br換行符轉(zhuǎn)換為文本輸入中換行符的方法【與函數(shù)nl2br功能相反】
這篇文章主要介紹了php自定義函數(shù)br2nl實(shí)現(xiàn)將html中br換行符轉(zhuǎn)換為文本輸入中換行符的方法,具有與函數(shù)nl2br相反的功能,并附帶了相應(yīng)的JS實(shí)現(xiàn)方法,需要的朋友可以參考下2017-02-02php + nginx項(xiàng)目中的權(quán)限詳解
這篇文章主要給大家介紹了關(guān)于php + nginx項(xiàng)目中權(quán)限的相關(guān)資料,文章介紹的非常詳細(xì),對(duì)大家具有一定的參考學(xué)習(xí)價(jià)值,需要的朋友們下面來一起看看吧。2017-05-05PHP使用array_merge重新排列數(shù)組下標(biāo)的方法
這篇文章主要介紹了PHP使用array_merge重新排列數(shù)組下標(biāo)的方法,以實(shí)例形式較為詳細(xì)的分析了array_merge的功能,及針對(duì)數(shù)組下標(biāo)進(jìn)行重新排列操作的實(shí)現(xiàn)技巧,需要的朋友可以參考下2015-07-07