php正則表達式獲取內容所有鏈接
更新時間:2015年07月24日 15:58:52 投稿:hebedich
這篇文章主要介紹了php正則表達式獲取內容所有鏈接的相關資料,需要的朋友可以參考下
方法一:
function get_all_url($code){ preg_match_all('/<as+href=["|']?([^>"' ]+)["|']?s*[^>]*>([^>]+)</a>/i',$code,$arr); return array('name'=>$arr[2],'url'=>$arr[1]); }
方法二:
/** * date 2015-07-24 **/ $site=substr($url,0,strpos($url,"/",8));//站點 $base=substr($url,0,strrpos($url,"/")+1);//文件所在目錄 $fp = fopen($url, "r" );//打開url while(!feof($fp))$contents.=fread($fp,1024);// $pattern="|href=['"]?([^ '"]+)['" ]|u"; preg_match_all($pattern,$contents, $regarr, preg_set_order);//匹配所有href= for($i=0;$i<count($regarr);$i++){//遍歷所有匹配 if(!eregi("://",$regarr[$i][1]))//是否是相對路徑,即是否還有:// if(substr($regarr[$i][1],0,1)=="/")//是否是站點的根目錄 echo "link".($i+1).":".$site.$regarr[$i][1]."<br/>";//根目錄 else echo "link".($i+1).":".$base.$regarr[$i][1]."<br/>";//當前目錄 else echo "link".($i+1).":".$regarr[$i][1]."<br/>";//相對路徑 } fclose($fp);
以上所述就是本文的全部內容了,希望大家能夠喜歡。
相關文章
PHP中使用file_get_contents抓取網頁中文亂碼問題解決方法
這篇文章主要介紹了PHP中使用file_get_contents抓取網頁中文亂碼問題解決方法,可以通過使用curl配置gzip選項來解決,具有一定的參考借鑒價值,需要的朋友可以參考下2014-12-12PHP中一個有趣的preg_replace函數(shù)詳解
這篇文章主要給大家介紹了關于PHP中一個有趣的preg_replace函數(shù)的相關資料,文中通過示例代碼介紹的非常詳細,對大家學習或者使用php具有一定的參考學習價值,需要的朋友們下面隨著小編來一起學習學習吧2018-08-08