PHP 抓取新浪讀書頻道的小說(shuō)并生成txt電子書的代碼
更新時(shí)間:2009年12月18日 22:08:03 作者:
想看什么電子書,先去新浪讀書搜索,然后填入對(duì)應(yīng)的參數(shù)即可
復(fù)制代碼 代碼如下:
/* Author: Yang Yu <yangyu@sina.cn> */
//想看什么電子書,先去新浪讀書搜索,然后填入對(duì)應(yīng)的參數(shù)即可
//http://vip.book.sina.com.cn/
//電子書參數(shù)
$array_book[0] = 38884; //小說(shuō)id
$array_book[1] = 22172; //章節(jié)起始id
$array_book[2] = 32533; //章節(jié)結(jié)束id
$array_book[3] = '中國(guó)特種部隊(duì)生存實(shí)錄:狼牙'; //小說(shuō)名字
//匹配參數(shù)
$title_pre = "/<h1>(.*?)<\/h1>/"; //標(biāo)題部分
$contents_pre = "/<div id=\"contTxt\" class=\"contTxt1\">(.*?)<\/div>/"; //內(nèi)容部分
//生成電子書
for( $i = $array_book[1]; $i <= $array_book[2]; $i++){
$url = "http://vip.book.sina.com.cn/book/chapter_{$array_book[0]}_{$i}.html";
$html = file_get_contents($url);
preg_match_all($title_pre,$html,$title);
preg_match_all($contents_pre,$html,$contents);
$fh = fopen($array_book[3].'.txt','a+');
$write_contents = $title[1][0]."\r\n".str_replace('</p>',"\r\n",str_replace('<p>',' ',$contents[1][0]))."\r\n";
if( fwrite($fh,$write_contents) ){
echo '第'.$i.'節(jié)抓取完畢< /br>';
}
fclose($fh);
}
您可能感興趣的文章:
- php pthreads多線程的安裝與使用
- 使用pthreads實(shí)現(xiàn)真正的PHP多線程(需PHP5.3以上版本)
- php結(jié)合curl實(shí)現(xiàn)多線程抓取
- PHP使用CURL實(shí)現(xiàn)多線程抓取網(wǎng)頁(yè)
- PHP多線程抓取網(wǎng)頁(yè)實(shí)現(xiàn)代碼
- php利用curl抓取新浪微博內(nèi)容示例
- PHP CURL模擬登錄新浪微博抓取頁(yè)面內(nèi)容 基于EaglePHP框架開(kāi)發(fā)
- PHP實(shí)現(xiàn)采集抓取淘寶網(wǎng)單個(gè)商品信息
- PHP實(shí)現(xiàn)抓取HTTPS內(nèi)容
- php使用pthreads v3多線程實(shí)現(xiàn)抓取新浪新聞信息操作示例
相關(guān)文章
PHP Oauth授權(quán)和本地加密實(shí)現(xiàn)方法
下面小編就為大家?guī)?lái)一篇PHP Oauth授權(quán)和本地加密實(shí)現(xiàn)方法。小編覺(jué)得挺不錯(cuò)的,現(xiàn)在就分享給大家,也給大家做個(gè)參考。一起跟隨小編過(guò)來(lái)看看吧2016-08-08php 判斷過(guò)去離現(xiàn)在幾年的函數(shù)(實(shí)例代碼)
下面小編就為大家?guī)?lái)一篇php 判斷過(guò)去離現(xiàn)在幾年的函數(shù)(實(shí)例代碼)。小編覺(jué)得挺不錯(cuò)的,現(xiàn)在就分享給大家,也給大家做個(gè)參考。一起跟隨小編過(guò)來(lái)看看吧2016-11-11php判斷手機(jī)訪問(wèn)還是電腦訪問(wèn)示例分享
這篇文章主要介紹了網(wǎng)站判斷是手機(jī)訪問(wèn)還是電腦訪問(wèn),然后顯示不同的信息,大家參考使用吧2014-01-01PHP實(shí)現(xiàn)rar解壓讀取擴(kuò)展包小結(jié)
今天重點(diǎn)給大家介紹PHP 擴(kuò)展就是針對(duì)于 rar 的壓縮包操作,不過(guò),PHP 的 rar 擴(kuò)展僅能讀取和解壓 rar 格式的壓縮包,并不能進(jìn)行壓縮操作,關(guān)于 rar 的壓縮操作并沒(méi)有找到太多有用的資料,下面通過(guò)本文一起學(xué)習(xí)下PHP rar解壓讀取知識(shí)吧2021-06-06php實(shí)現(xiàn)文件下載功能的幾個(gè)代碼分享
我們一般實(shí)現(xiàn)下載都是調(diào)用url來(lái)下載,但是遇到ie能識(shí)別打開(kāi)的文件就不能用這種方式了,比如下載一個(gè)圖片、html網(wǎng)頁(yè)等,這時(shí)就需要編程來(lái)實(shí)現(xiàn)2014-05-05Symfony2之session與cookie用法小結(jié)
這篇文章主要介紹了Symfony2之session與cookie用法,結(jié)合實(shí)例形式總結(jié)分析了Symfony框架針對(duì)session與cookie的設(shè)置、獲取及刪除等操作的實(shí)現(xiàn)方法,需要的朋友可以參考下2016-03-03php設(shè)計(jì)模式之職責(zé)鏈模式實(shí)例分析【星際爭(zhēng)霸游戲案例】
這篇文章主要介紹了php設(shè)計(jì)模式之職責(zé)鏈模式,結(jié)合星際爭(zhēng)霸游戲案例形式分析了php職責(zé)鏈模式相關(guān)概念、原理、用法及操作注意事項(xiàng),需要的朋友可以參考下2020-03-03