PHP實(shí)現(xiàn)的抓取小說(shuō)網(wǎng)站內(nèi)容功能示例
本文實(shí)例講述了PHP實(shí)現(xiàn)的抓取小說(shuō)網(wǎng)站內(nèi)容功能。分享給大家供大家參考,具體如下:
爬取免費(fèi)內(nèi)容,弄到手機(jī),聽(tīng)書(shū),妥妥的。
ini_set('user_agent','Mozilla/4.0 (compatible; MSIE 7.0; Windows NT 5.1; .NET CLR 2.0.50727; .NET CLR 3.0.04506.30; GreenBrowser)');
ini_set('max_execution_time', '0');
$base = 'https://www.qu.la/book/19434/';
$start = '7504808.html';
$content_grep = '/ (.*)<br\/>/';
//$content_grep = '/<div id="content">(.*)<br\/>/sS';
$next_grep = '/<a id="pager_next" href=\"(\d+\.html)\" target="_top" class="next">下一章<\/a>/';
$next = $start;
$file_name = '聽(tīng)書(shū)了.txt';
while($next) {
echo 'getting ' . $next . PHP_EOL;
$result = file_get_contents($base . $next);
preg_match_all($content_grep, $result, $match);
$isTitle = true;
$content = "";
foreach($match[1] as $line) {
$line = str_replace("<br/>", '', $line);
$line = str_replace(" ", '', $line);
if($isTitle) {
$content = $line . PHP_EOL . PHP_EOL;
$isTitle = false;
} else {
$content .= ' ' . $line . PHP_EOL . PHP_EOL;
}
}
$file = fopen($file_name, 'a');
echo 'write length: ' . strlen($content) . PHP_EOL;
fwrite($file, $content);
fclose($file);
echo '.';
preg_match($next_grep, $result, $match);
$next = $match[1];
}
更多關(guān)于PHP相關(guān)內(nèi)容感興趣的讀者可查看本站專(zhuān)題:《php socket用法總結(jié)》、《php字符串(string)用法總結(jié)》、《PHP數(shù)學(xué)運(yùn)算技巧總結(jié)》、《php面向?qū)ο蟪绦蛟O(shè)計(jì)入門(mén)教程》、《PHP數(shù)組(Array)操作技巧大全》、《PHP數(shù)據(jù)結(jié)構(gòu)與算法教程》、《php程序設(shè)計(jì)算法總結(jié)》及《PHP網(wǎng)絡(luò)編程技巧總結(jié)》
希望本文所述對(duì)大家PHP程序設(shè)計(jì)有所幫助。
- PHP 抓取新浪讀書(shū)頻道的小說(shuō)并生成txt電子書(shū)的代碼
- 使用PHP curl模擬瀏覽器抓取網(wǎng)站信息
- php抓取并保存網(wǎng)站圖片的實(shí)現(xiàn)代碼
- PHP抓取、分析國(guó)內(nèi)視頻網(wǎng)站的視頻信息工具類(lèi)
- php抓取網(wǎng)站圖片并保存的實(shí)現(xiàn)方法
- thinkphp 抓取網(wǎng)站的內(nèi)容并且保存到本地的實(shí)例詳解
- PHP封裝的遠(yuǎn)程抓取網(wǎng)站圖片并保存功能類(lèi)
- php抓取頁(yè)面與代碼解析 推薦
- PHP實(shí)現(xiàn)抓取HTTPS內(nèi)容
- php抓取頁(yè)面的幾種方法詳解
相關(guān)文章
PHP擴(kuò)展mcrypt實(shí)現(xiàn)的AES加密功能示例
這篇文章主要介紹了PHP擴(kuò)展mcrypt實(shí)現(xiàn)的AES加密功能,結(jié)合實(shí)例形式分析了php基于mcrypt實(shí)現(xiàn)AES加密的相關(guān)操作技巧,需要的朋友可以參考下2019-01-01
PHP錯(cuò)誤提示It is not safe to rely on the system……的解決方法
今天小編就為大家分享一篇關(guān)于PHP錯(cuò)誤提示It is not safe to rely on the system……的解決方法,小編覺(jué)得內(nèi)容挺不錯(cuò)的,現(xiàn)在分享給大家,具有很好的參考價(jià)值,需要的朋友一起跟隨小編來(lái)看看吧2019-03-03
PHP中兩個(gè)float(浮點(diǎn)數(shù))比較實(shí)例分析
這篇文章主要介紹了PHP中兩個(gè)float(浮點(diǎn)數(shù))比較,以完整實(shí)例形式分析了bccomp函數(shù)用于浮點(diǎn)數(shù)比較的使用技巧,具有一定參考借鑒價(jià)值,需要的朋友可以參考下2015-09-09
PHP中如何調(diào)用webservice的實(shí)例參考
本篇文章介紹了,PHP中如何調(diào)用webservice的實(shí)例參考。需要的朋友參考下2013-04-04
PHP中函數(shù)gzuncompress無(wú)法使用的解決方法
這篇文章主要介紹了PHP中函數(shù)gzuncompress無(wú)法使用的解決方法,文中的介紹的很詳細(xì),需要的朋友可以參考借鑒,下面來(lái)一起看看吧。2017-03-03
thinkphp5.1 框架鉤子和行為用法實(shí)例分析
這篇文章主要介紹了thinkphp5.1 框架鉤子和行為用法,結(jié)合實(shí)例形式分析了thinkphp5.1 框架鉤子和行為基本功能、定義、用法及操作注意事項(xiàng),需要的朋友可以參考下2020-05-05

