php正則表達(dá)式獲取內(nèi)容所有鏈接
更新時間:2015年07月24日 15:58:52 投稿:hebedich
這篇文章主要介紹了php正則表達(dá)式獲取內(nèi)容所有鏈接的相關(guān)資料,需要的朋友可以參考下
方法一:
function get_all_url($code){ preg_match_all('/<as+href=["|']?([^>"' ]+)["|']?s*[^>]*>([^>]+)</a>/i',$code,$arr); return array('name'=>$arr[2],'url'=>$arr[1]); }
方法二:
/** * date 2015-07-24 **/ $site=substr($url,0,strpos($url,"/",8));//站點 $base=substr($url,0,strrpos($url,"/")+1);//文件所在目錄 $fp = fopen($url, "r" );//打開url while(!feof($fp))$contents.=fread($fp,1024);// $pattern="|href=['"]?([^ '"]+)['" ]|u"; preg_match_all($pattern,$contents, $regarr, preg_set_order);//匹配所有href= for($i=0;$i<count($regarr);$i++){//遍歷所有匹配 if(!eregi("://",$regarr[$i][1]))//是否是相對路徑,即是否還有:// if(substr($regarr[$i][1],0,1)=="/")//是否是站點的根目錄 echo "link".($i+1).":".$site.$regarr[$i][1]."<br/>";//根目錄 else echo "link".($i+1).":".$base.$regarr[$i][1]."<br/>";//當(dāng)前目錄 else echo "link".($i+1).":".$regarr[$i][1]."<br/>";//相對路徑 } fclose($fp);
以上所述就是本文的全部內(nèi)容了,希望大家能夠喜歡。
相關(guān)文章
PHP中使用file_get_contents抓取網(wǎng)頁中文亂碼問題解決方法
這篇文章主要介紹了PHP中使用file_get_contents抓取網(wǎng)頁中文亂碼問題解決方法,可以通過使用curl配置gzip選項來解決,具有一定的參考借鑒價值,需要的朋友可以參考下2014-12-12PHP+Ajax實時自動檢測是否聯(lián)網(wǎng)的方法
這篇文章主要介紹了PHP+Ajax實時自動檢測是否聯(lián)網(wǎng)的方法,通過Ajax調(diào)用連接百度效果實現(xiàn)檢測網(wǎng)站是否聯(lián)網(wǎng)的功能,需要的朋友可以參考下2015-07-07PHP中一個有趣的preg_replace函數(shù)詳解
這篇文章主要給大家介紹了關(guān)于PHP中一個有趣的preg_replace函數(shù)的相關(guān)資料,文中通過示例代碼介紹的非常詳細(xì),對大家學(xué)習(xí)或者使用php具有一定的參考學(xué)習(xí)價值,需要的朋友們下面隨著小編來一起學(xué)習(xí)學(xué)習(xí)吧2018-08-08