使用Curl進(jìn)行抓取遠(yuǎn)程內(nèi)容時(shí)url中文編碼問題示例探討
更新時(shí)間:2013年10月29日 16:24:34 作者:
在編碼時(shí)應(yīng)該只對(duì)部分URL編碼,否則URL中的冒號(hào)和反斜杠也會(huì)被轉(zhuǎn)義,下面有兩個(gè)不錯(cuò)的示例,有類似情況的朋友可以感受下
PHP中對(duì)于URL進(jìn)行編碼,可以使用 urlencode() 或者 rawurlencode(),二者的區(qū)別是前者把空格編碼為 '+',而后者把空格編碼為 '%20',不過應(yīng)該注意的是,在編碼時(shí)應(yīng)該只對(duì)部分URL編碼,否則URL中的冒號(hào)和反斜杠也會(huì)被轉(zhuǎn)義。下面是詳細(xì)解釋:
string urlencode( string str)
返回字符串,此字符串中除了 -_. 之外的所有非字母數(shù)字字符都將被替換成百分號(hào)(%)后跟兩位十六進(jìn)制數(shù),空格則編碼為加號(hào)(+)。
例子 1 :urlencode函數(shù)與rawurlencode函數(shù)區(qū)別
$str='博 客';
echo urlencode($str);
echo "<br>";
echo rawurlencode($str);
url結(jié)果:
%B2%A9+%BF%CD
%B2%A9%20%BF%CD
例子 2 :url中文編碼方法
從url:"http://www.baidu.com/s?wd=博 客" 轉(zhuǎn)為 url:"http://www.baidu.com/s?wd=%E5%8D%9A%20%E5%AE%A2";
$url='http://www.baidu.com/s?wd=博 客';
$arr=explode('=',$url);
$url=$arr[0].'='.rawurlencode($arr[1]);
echo $url;
結(jié)果:
http://www.baidu.com/s?wd=%E5%8D%9A%20%E5%AE%A2
或許用以下url編碼函數(shù)
function cn_urlencode($url){
$pregstr = "/[\x{4e00}-\x{9fa5}]+/u";//UTF-8中文正則
if(preg_match_all($pregstr,$url,$matchArray)){//匹配中文,返回?cái)?shù)組
foreach($matchArray[0] as $key=>$val){
$url=str_replace($val, urlencode($val), $url);//將轉(zhuǎn)譯替換中文
}
if(strpos($url,' ')){//若存在空格
$url=str_replace(' ','%20',$url);
}
}
return $url;
}
url結(jié)果:
http://www.baidu.com/s?wd=%E5%8D%9A%20%E5%AE%A2
復(fù)制代碼 代碼如下:
string urlencode( string str)
返回字符串,此字符串中除了 -_. 之外的所有非字母數(shù)字字符都將被替換成百分號(hào)(%)后跟兩位十六進(jìn)制數(shù),空格則編碼為加號(hào)(+)。
例子 1 :urlencode函數(shù)與rawurlencode函數(shù)區(qū)別
復(fù)制代碼 代碼如下:
$str='博 客';
echo urlencode($str);
echo "<br>";
echo rawurlencode($str);
url結(jié)果:
復(fù)制代碼 代碼如下:
%B2%A9+%BF%CD
%B2%A9%20%BF%CD
例子 2 :url中文編碼方法
從url:"http://www.baidu.com/s?wd=博 客" 轉(zhuǎn)為 url:"http://www.baidu.com/s?wd=%E5%8D%9A%20%E5%AE%A2";
復(fù)制代碼 代碼如下:
$url='http://www.baidu.com/s?wd=博 客';
$arr=explode('=',$url);
$url=$arr[0].'='.rawurlencode($arr[1]);
echo $url;
結(jié)果:
http://www.baidu.com/s?wd=%E5%8D%9A%20%E5%AE%A2
或許用以下url編碼函數(shù)
復(fù)制代碼 代碼如下:
function cn_urlencode($url){
$pregstr = "/[\x{4e00}-\x{9fa5}]+/u";//UTF-8中文正則
if(preg_match_all($pregstr,$url,$matchArray)){//匹配中文,返回?cái)?shù)組
foreach($matchArray[0] as $key=>$val){
$url=str_replace($val, urlencode($val), $url);//將轉(zhuǎn)譯替換中文
}
if(strpos($url,' ')){//若存在空格
$url=str_replace(' ','%20',$url);
}
}
return $url;
}
url結(jié)果:
http://www.baidu.com/s?wd=%E5%8D%9A%20%E5%AE%A2
相關(guān)文章
php基于環(huán)形鏈表解決約瑟夫環(huán)問題示例
這篇文章主要介紹了php基于環(huán)形鏈表解決約瑟夫環(huán)問題,結(jié)合具體實(shí)例形式分析了php環(huán)形鏈表的定義及基于環(huán)形鏈表解決約瑟夫環(huán)的具體步驟與相關(guān)操作技巧,需要的朋友可以參考下2017-11-11php使用Jpgraph創(chuàng)建3D餅形圖效果示例
這篇文章主要介紹了php使用Jpgraph創(chuàng)建3D餅形圖效果,結(jié)合實(shí)例形式分析了php基于Jpgraph繪制圖形的原理、實(shí)現(xiàn)步驟與相關(guān)操作技巧,需要的朋友可以參考下2017-02-02PHP 面向?qū)ο蟾倪M(jìn)后的一點(diǎn)說明
學(xué)習(xí)php 面向?qū)ο蟮呐笥?,需要了解的東西。2008-10-10php實(shí)現(xiàn)的驗(yàn)證碼文件類實(shí)例
這篇文章主要介紹了php實(shí)現(xiàn)的驗(yàn)證碼文件類,實(shí)例分析了php生成驗(yàn)證碼文件的技巧,非常具有實(shí)用價(jià)值,需要的朋友可以參考下2015-06-06PHP cookie,session的使用與用戶自動(dòng)登錄功能實(shí)現(xiàn)方法分析
這篇文章主要介紹了PHP cookie,session的使用與用戶自動(dòng)登錄功能實(shí)現(xiàn)方法,結(jié)合實(shí)例形式分析了php使用cookie與session進(jìn)行數(shù)據(jù)存取以及實(shí)現(xiàn)自動(dòng)登陸功能的相關(guān)操作技巧,需要的朋友可以參考下2019-06-06