php 獲取頁面中指定內(nèi)容的實(shí)現(xiàn)類
更新時(shí)間:2014年01月23日 17:24:06 作者:
本文為大家下使用php如何獲取頁面中的指定內(nèi)容,而且以封裝成類,需要的朋友可以參考下本文
功能:
1.獲取內(nèi)容中的url,email,image。
2.替換內(nèi)容中的url,email,image。
url:<a href="url">xxx</a>
email:admin@admin.com
image:<img src="image">
Grep.class.php
<?php
/** grep class
* Date: 2013-06-15
* Author: fdipzone
* Ver: 1.0
*
* Func:
*
* set: 設(shè)置內(nèi)容
* get: 返回指定的內(nèi)容
* replace: 返回替換后的內(nèi)容
* get_pattern 根據(jù)type返回pattern
*/
class Grep{ // class start
private $_pattern = array(
'url' => '/<a.*?href="((http(s)?:\/\/).*?)".*?/si',
'email' => '/([\w\-\.]+@[\w\-\.]+(\.\w+))/',
'image' => '/<img.*?src=\"(http:\/\/.+\.(jpg|jpeg|gif|bmp|png))\">/i'
);
private $_content = ''; // 源內(nèi)容
/* 設(shè)置搜尋的內(nèi)容
* @param String $content
*/
public function set($content=''){
$this->_content = $content;
}
/* 獲取指定內(nèi)容
* @param String $type
* @param int $unique 0:all 1:unique
* @return Array
*/
public function get($type='', $unique=0){
$type = strtolower($type);
if($this->_content=='' || !in_array($type, array_keys($this->_pattern))){
return array();
}
$pattern = $this->get_pattern($type); // 獲取pattern
preg_match_all($pattern, $this->_content, $matches);
return isset($matches[1])? ( $unique==0? $matches[1] : array_unique($matches[1]) ) : array();
}
/* 獲取替換后的內(nèi)容
* @param String $type
* @param String $callback
* @return String
*/
public function replace($type='', $callback=''){
$type = strtolower($type);
if($this->_content=='' || !in_array($type, array_keys($this->_pattern)) || $callback==''){
return $this->_content;
}
$pattern = $this->get_pattern($type);
return preg_replace_callback($pattern, $callback, $this->_content);
}
/* 根據(jù)type獲取pattern
* @param String $type
* @return String
*/
private function get_pattern($type){
return $this->_pattern[$type];
}
} // class end
?>
Demo
<?php
header('content-type:text/htm;charset=utf8');
require('Grep.class.php');
$content = file_get_contents('http://www.test.com/');
$obj = new Grep();
$obj->set($content);
$url = $obj->get('url', 0);
$email = $obj->get('email', 1);
$image = $obj->get('image', 1);
print_r($url);
print_r($email);
print_r($image);
$url_new = $obj->replace('url', 'replace_url');
echo $url_new;
function replace_url($matches){
return isset($matches[1])? '[url]'.$matches[1].'[/url]' : '';
}
?>
1.獲取內(nèi)容中的url,email,image。
2.替換內(nèi)容中的url,email,image。
url:<a href="url">xxx</a>
email:admin@admin.com
image:<img src="image">
Grep.class.php
復(fù)制代碼 代碼如下:
<?php
/** grep class
* Date: 2013-06-15
* Author: fdipzone
* Ver: 1.0
*
* Func:
*
* set: 設(shè)置內(nèi)容
* get: 返回指定的內(nèi)容
* replace: 返回替換后的內(nèi)容
* get_pattern 根據(jù)type返回pattern
*/
class Grep{ // class start
private $_pattern = array(
'url' => '/<a.*?href="((http(s)?:\/\/).*?)".*?/si',
'email' => '/([\w\-\.]+@[\w\-\.]+(\.\w+))/',
'image' => '/<img.*?src=\"(http:\/\/.+\.(jpg|jpeg|gif|bmp|png))\">/i'
);
private $_content = ''; // 源內(nèi)容
/* 設(shè)置搜尋的內(nèi)容
* @param String $content
*/
public function set($content=''){
$this->_content = $content;
}
/* 獲取指定內(nèi)容
* @param String $type
* @param int $unique 0:all 1:unique
* @return Array
*/
public function get($type='', $unique=0){
$type = strtolower($type);
if($this->_content=='' || !in_array($type, array_keys($this->_pattern))){
return array();
}
$pattern = $this->get_pattern($type); // 獲取pattern
preg_match_all($pattern, $this->_content, $matches);
return isset($matches[1])? ( $unique==0? $matches[1] : array_unique($matches[1]) ) : array();
}
/* 獲取替換后的內(nèi)容
* @param String $type
* @param String $callback
* @return String
*/
public function replace($type='', $callback=''){
$type = strtolower($type);
if($this->_content=='' || !in_array($type, array_keys($this->_pattern)) || $callback==''){
return $this->_content;
}
$pattern = $this->get_pattern($type);
return preg_replace_callback($pattern, $callback, $this->_content);
}
/* 根據(jù)type獲取pattern
* @param String $type
* @return String
*/
private function get_pattern($type){
return $this->_pattern[$type];
}
} // class end
?>
Demo
復(fù)制代碼 代碼如下:
<?php
header('content-type:text/htm;charset=utf8');
require('Grep.class.php');
$content = file_get_contents('http://www.test.com/');
$obj = new Grep();
$obj->set($content);
$url = $obj->get('url', 0);
$email = $obj->get('email', 1);
$image = $obj->get('image', 1);
print_r($url);
print_r($email);
print_r($image);
$url_new = $obj->replace('url', 'replace_url');
echo $url_new;
function replace_url($matches){
return isset($matches[1])? '[url]'.$matches[1].'[/url]' : '';
}
?>
相關(guān)文章
基于PHP Socket配置以及實(shí)例的詳細(xì)介紹
本篇文章是對PHP中Socket的配置以及實(shí)例進(jìn)行了詳細(xì)的分析介紹,需要的朋友參考下2013-06-06PHP判斷訪客是否手機(jī)端(移動端瀏覽器)訪問的方法總結(jié)【4種方法】
這篇文章主要介紹了PHP判斷訪客是否手機(jī)端(移動端瀏覽器)訪問的方法,結(jié)合實(shí)例形式總結(jié)分析了php基于HTTP_X_WAP_PROFILE、HTTP_VIA、HTTP_USER_AGENT、HTTP_ACCEPT等4種方法判斷訪客類型的相關(guān)操作技巧,需要的朋友可以參考下2019-03-03