php 信息采集程序代碼
更新時間:2009年03月17日 23:19:14 作者:
通過檢測,$c已經(jīng)是內(nèi)容頁的數(shù)據(jù)流了,可是$pc這個的正則表達(dá)式為什么只匹配<這個字符其他的都沒有呢
復(fù)制代碼 代碼如下:
<?
//采集首頁地址
$url="http://emotion.pclady.com.cn/skills/";
//獲取頁面代碼
$rs=file_get_contents($url);
//設(shè)置匹配正則
//$fp=fopen("text.txt","a");
//$fw=fwrite($fp,$rs);
//fclose($fp);
/*<I class=titles><A
target=_blank>留住你身邊的好男人</A></I>*/
$preg='/<i\s+class=\"titles\"><a\s+href=\"[^>]+\">(.*)<\/a><\/i>/i';
//進(jìn)行正則搜索
preg_match_all($preg,$rs,$title);
//計(jì)算標(biāo)題數(shù)量
$count=count($title[0]);
echo $count."<br>";
//通過標(biāo)題數(shù)量進(jìn)行內(nèi)容采集
for ($i=0;$i<$count;$i++){
//設(shè)置內(nèi)容頁地址
$pr='/<a\s+href=\"[^>]+\">/isU';
preg_match_all($pr,$title[0][$i],$jurl);
$substr=substr($jurl[0][0],9);
$curl=substr($substr,0,-18);
//獲取內(nèi)容頁代碼
$c=file_get_contents($curl);
//設(shè)置內(nèi)容頁匹配正則
$pc='/<a\s+href=\"[^>]+\">/i';
//進(jìn)行正則匹配搜索
preg_match($pc,$c,$content);
//輸出標(biāo)題
echo $title[0][$i]."<br>";
echo $title[1][$i]."<br>";
$concount=count($content[0]);
echo $concount."<br>";
echo $content[0][0];
for ($j=0;$j<$concount;$j++){
}
}
?>
通過檢測,$c已經(jīng)是內(nèi)容頁的數(shù)據(jù)流了,可是$pc這個的正則表達(dá)式為什么只匹配<這個字符其他的都沒有呢,是因?yàn)槲疑厦嬗昧藄ubsrt()函數(shù)嗎?還是什么問題?麻煩各位大俠指點(diǎn)迷津???
相關(guān)文章
PHP實(shí)現(xiàn)瀏覽器中直接輸出圖片的方法示例
這篇文章主要介紹了PHP實(shí)現(xiàn)瀏覽器中直接輸出圖片的方法,結(jié)合實(shí)例形式分析了php輸出圖片的原理與相關(guān)操作技巧,需要的朋友可以參考下2018-03-03php創(chuàng)建桌面快捷方式實(shí)現(xiàn)方法
這篇文章主要介紹了php創(chuàng)建桌面快捷方式實(shí)現(xiàn)方法,需要的朋友可以參考下2015-12-12PHP基于遞歸實(shí)現(xiàn)的約瑟夫環(huán)算法示例
這篇文章主要介紹了PHP基于遞歸實(shí)現(xiàn)的約瑟夫環(huán)算法,結(jié)合實(shí)例形式較為詳細(xì)的分析了約瑟夫環(huán)問題與php使用遞歸算法的解決方法,需要的朋友可以參考下2017-08-08實(shí)現(xiàn)php刪除鏈表中重復(fù)的結(jié)點(diǎn)
在本篇文章中,我們給大家?guī)砹岁P(guān)于php刪除鏈表中重復(fù)的結(jié)點(diǎn)的相關(guān)知識點(diǎn)內(nèi)容以及相關(guān)代碼,有興趣的朋友們參考下。2018-09-09php中ob_flush函數(shù)和flush函數(shù)用法分析
這篇文章主要介紹了php中ob_flush函數(shù)和flush函數(shù)用法,實(shí)例分析了ob_flush函數(shù)和flush函數(shù)的功能及相關(guān)的使用技巧,具有一定參考借鑒價(jià)值,需要的朋友可以參考下2015-03-03