快捷導(dǎo)航

php 采集書并合成txt格式的實(shí)現(xiàn)代碼

更新時(shí)間：2009年03月01日 23:15:53 作者：

記得上次有過(guò)一個(gè)叫采集后的處理這個(gè)就是它的升級(jí)版本連采再處理，合成一本書txt的。

<?php
/**
* @name 采集書.php
* @date Sun Mar 01 22:48:02 CST 2009
* @copyright 馬永占(MyZ)
* @author 馬永占(MyZ)
* @link http://blog.csdn.net/mayongzhan/
*/
//header('Content-Type:text/html;charset=utf8');
header('Content-Type:text/html;charset=gb2312');
error_reporting(E_ALL);
date_default_timezone_set('Asia/Shanghai');
set_time_limit(0);
function writer($content,$url)
{
$fp = fopen($url, 'ab');
fwrite($fp, $content);
fclose($fp);
}
$folder = '2'; //文件夾
$book_base_url = 'xxxxxxxxxxxxxxxxxxxxx';
$book_url = 'yyyyyyyyyyyyy.html';
$main = file_get_contents($book_base_url.$book_url);
preg_match_all('/chapter_.*?\.html/', $main, $pages);
$pages = array_unique($pages[0]);
foreach ($pages as $value) {
writer(file_get_contents($book_base_url.$value), './'.$folder.'/'.$value.'.txt');
$str = file_get_contents('./'.$folder.'/'.$value.'.txt');
//print_r($str);
preg_match("/(<h1>)(.*?)(<\/h1>)(.*?)(<div id=\"contTxt\" class=\"contTxt1\">)(.*?)(<\/div>)/s",$str,$arr);
//print_r($arr);die();
$arr[6] = preg_replace("/(<span[^>]+>.*?<a[^>]+>)(.*?)(<\/a><\/span>)/s","$2",preg_replace("/<p>|<\/p>/","\r\n",$arr[6]));
$result = "\r\n------------------------------------------------\r\n------------------------------------------------\r\n------------------------------------------------\r\n----------------".$arr[2]."\r\n------------------------------------------------\r\n------------------------------------------------\r\n------------------------------------------------\r\n".$arr[6];
writer($result, './'.$folder.'/new.txt');
}
?>

您可能感興趣的文章:

相關(guān)文章

處理(php-cgi.exe?-?FastCGI?進(jìn)程超過(guò)了配置的請(qǐng)求超時(shí)時(shí)限)的問(wèn)題
本篇文章是對(duì)解決(php-cgi.exe?-?FastCGI?進(jìn)程超過(guò)了配置的請(qǐng)求超時(shí)時(shí)限)的問(wèn)題進(jìn)行了詳細(xì)的分析介紹，需要的朋友參考下
2013-07-07
php 獲得漢字拼音首字母的函數(shù)
php 獲得漢字拼音首字母的函數(shù)，大家可以自行測(cè)試。
2009-08-08
PHP將身份證正反面兩張照片合成一張圖片的代碼
本文介紹將身份證正反兩張圖片在PHP中如何合成一張圖片，還可以給圖片打上水印,需要的朋友可以參考下
2017-04-04
php實(shí)現(xiàn)Mysql簡(jiǎn)易操作類
這個(gè)PHP實(shí)現(xiàn)的mysql的操作類完整版已經(jīng)使用過(guò)了，而這個(gè)簡(jiǎn)化版是經(jīng)過(guò)修改完整版后的簡(jiǎn)化版，適用在一般的 PHP 應(yīng)用中，功能上可以實(shí)現(xiàn)基本的增刪改查的操作，以及打印 MYSQL 錯(cuò)誤，自我感覺(jué)不錯(cuò)，如果網(wǎng)站應(yīng)用不是很強(qiáng)大，應(yīng)用這個(gè) MYSQL 的操作類已經(jīng)足夠了，
2015-10-10
windows下PHP APACHE MYSQ完整配置
windows下PHP APACHE MYSQ完整配置...
2007-01-01
PHP使用遞歸方式列出當(dāng)前目錄下所有文件的方法
這篇文章主要介紹了PHP使用遞歸方式列出當(dāng)前目錄下所有文件的方法,涉及php遞歸操作文件的相關(guān)技巧,需要的朋友可以參考下
2015-06-06
PHP實(shí)現(xiàn)的隨機(jī)紅包算法示例
這篇文章主要介紹了PHP實(shí)現(xiàn)的隨機(jī)紅包算法,結(jié)合實(shí)例形式分析了php隨機(jī)紅包算法的原理、實(shí)現(xiàn)方法與相關(guān)注意事項(xiàng),需要的朋友可以參考下
2017-08-08
PHP字符串與數(shù)組處理函數(shù)用法小結(jié)
這篇文章主要介紹了PHP字符串與數(shù)組處理函數(shù)用法,結(jié)合實(shí)例形式詳細(xì)分析了PHP字符串與數(shù)組常用處理函數(shù)功能、定義、使用方法與操作注意事項(xiàng),需要的朋友可以參考下
2020-01-01
php自動(dòng)給網(wǎng)址加上鏈接的方法
這篇文章主要介紹了php自動(dòng)給網(wǎng)址加上鏈接的方法,可實(shí)現(xiàn)對(duì)本文中的網(wǎng)址加上鏈接的功能,涉及正則匹配的相關(guān)技巧,需要的朋友可以參考下
2015-06-06
PHP中substr函數(shù)字符串截取用法分析
這篇文章主要介紹了PHP中substr函數(shù)字符串截取用法,結(jié)合實(shí)例形式分析說(shuō)明的PHP中substr函數(shù)的功能,定義與具體使用技巧,需要的朋友可以參考下
2016-01-01