淺析php插件 HTMLPurifier HTML解析器
更新時(shí)間:2013年07月01日 11:31:33 作者:
本篇文章是對(duì)php插件 HTMLPurifier HTML解析器進(jìn)行了詳細(xì)的分析介紹,需要的朋友參考下
HTMLPurifier插件的使用
下載HTMLPurifier插件
HTMLPurifier插件有用的部分是 library
<?php
require_once 'HTMLPurifier.auto.php';
$config = HTMLPurifier_Config::createDefault();
?>
或者
<?php
require_once 'HTMLPurifier.includes.php';
require_once 'HTMLPurifier.autoload.php';
$config = HTMLPurifier_Config::createDefault();
?>
官網(wǎng)給出的例子是
require_once 'HTMLPurifier.auto.php';
我同事常用的是
require_once 'HTMLPurifier.includes.php';
require_once 'HTMLPurifier.autoload.php';
設(shè)置$config
configdoc
http://htmlpurifier.org/live/configdoc/plain.html
例子
$config->set('HTML.AllowedElements', array('div'=>true, 'table'=>true, 'tr'=>true, 'td'=>true, 'br'=>true));
$config->set('HTML.Doctype', 'XHTML 1.0 Transitional') //html文檔類型(常設(shè))
$config->set('Core.Encoding', 'UTF-8') //字符編碼(常設(shè))
HTML允許的元素
div元素,table元素,tr元素,td元素,br元素
new HTMLPurifier對(duì)象
$purifier = new HTMLPurifier($config);
調(diào)用HTMLPurifier對(duì)象的purify方法
$puri_html = $purifier->purify($html);
第二種方式
自定義一個(gè)類 HtmlPurifier.php
<?php
require_once 'HTMLPurifier.includes.php';
require_once 'HTMLPurifier.autoload.php';
class Resume_HtmlPurifier implements Zend_Filter_Interface{
protected $_htmlPurifier = null;
public function __construct($options = null)
{
$config = HTMLPurifier_Config::createDefault();
$config->set('Code.Encoding', 'UTF-8');
$config->set('HTML.Doctype', 'XHTML 1.0 Transitional')
if(!is_null($options)){
foreach($options as $option){
$config->set($option[0], $option[1], $option[2]);
}
}
$this->_htmlPurifier = new HTMLPurifier($config);
}
public function filter($value)
{
return $this->_htmlPurifier->purify($value);
}
}
?>
設(shè)置config信息
例如:
$conf = array(
array('HTML.AllowedElements',
array(
'div' => true,
'table' => true,
'tr' => true,
'td' => true,
'br' => true,
),
false), //允許屬性 div table tr td br元素
array('HTML.AllowedAttributes', array('class' => TRUE), false), //允許屬性 class
array('Attr.ForbiddenClasses', array('resume_p' => TRUE), false), //禁止classes如
array('AutoFormat.RemoveEmpty', true, false), //去空格
array('AutoFormat.RemoveEmpty.RemoveNbsp', true, false), //去nbsp
array('URI.Disable', true, false),
);
調(diào)用
$p = new Resume_HtmlPurifier($conf);
$puri_html = $p->filter($html);
下載HTMLPurifier插件
HTMLPurifier插件有用的部分是 library
使用HTMLPurifier library類庫(kù)
第一種方式
復(fù)制代碼 代碼如下:
<?php
require_once 'HTMLPurifier.auto.php';
$config = HTMLPurifier_Config::createDefault();
?>
或者
復(fù)制代碼 代碼如下:
<?php
require_once 'HTMLPurifier.includes.php';
require_once 'HTMLPurifier.autoload.php';
$config = HTMLPurifier_Config::createDefault();
?>
官網(wǎng)給出的例子是
復(fù)制代碼 代碼如下:
require_once 'HTMLPurifier.auto.php';
我同事常用的是
復(fù)制代碼 代碼如下:
require_once 'HTMLPurifier.includes.php';
require_once 'HTMLPurifier.autoload.php';
設(shè)置$config
configdoc
http://htmlpurifier.org/live/configdoc/plain.html
例子
復(fù)制代碼 代碼如下:
$config->set('HTML.AllowedElements', array('div'=>true, 'table'=>true, 'tr'=>true, 'td'=>true, 'br'=>true));
$config->set('HTML.Doctype', 'XHTML 1.0 Transitional') //html文檔類型(常設(shè))
$config->set('Core.Encoding', 'UTF-8') //字符編碼(常設(shè))
HTML允許的元素
div元素,table元素,tr元素,td元素,br元素
new HTMLPurifier對(duì)象
復(fù)制代碼 代碼如下:
$purifier = new HTMLPurifier($config);
調(diào)用HTMLPurifier對(duì)象的purify方法
復(fù)制代碼 代碼如下:
$puri_html = $purifier->purify($html);
第二種方式
自定義一個(gè)類 HtmlPurifier.php
復(fù)制代碼 代碼如下:
<?php
require_once 'HTMLPurifier.includes.php';
require_once 'HTMLPurifier.autoload.php';
class Resume_HtmlPurifier implements Zend_Filter_Interface{
protected $_htmlPurifier = null;
public function __construct($options = null)
{
$config = HTMLPurifier_Config::createDefault();
$config->set('Code.Encoding', 'UTF-8');
$config->set('HTML.Doctype', 'XHTML 1.0 Transitional')
if(!is_null($options)){
foreach($options as $option){
$config->set($option[0], $option[1], $option[2]);
}
}
$this->_htmlPurifier = new HTMLPurifier($config);
}
public function filter($value)
{
return $this->_htmlPurifier->purify($value);
}
}
?>
設(shè)置config信息
例如:
復(fù)制代碼 代碼如下:
$conf = array(
array('HTML.AllowedElements',
array(
'div' => true,
'table' => true,
'tr' => true,
'td' => true,
'br' => true,
),
false), //允許屬性 div table tr td br元素
array('HTML.AllowedAttributes', array('class' => TRUE), false), //允許屬性 class
array('Attr.ForbiddenClasses', array('resume_p' => TRUE), false), //禁止classes如
array('AutoFormat.RemoveEmpty', true, false), //去空格
array('AutoFormat.RemoveEmpty.RemoveNbsp', true, false), //去nbsp
array('URI.Disable', true, false),
);
調(diào)用
復(fù)制代碼 代碼如下:
$p = new Resume_HtmlPurifier($conf);
$puri_html = $p->filter($html);
您可能感興趣的文章:
- PHP解析html類庫(kù)simple_html_dom的轉(zhuǎn)碼bug
- php解析html類庫(kù)simple_html_dom(詳細(xì)介紹)
- 淺析php插件 Simple HTML DOM 用DOM方式處理HTML
- PHP simple_html_dom.php+正則 采集文章代碼
- WordPress中轉(zhuǎn)義HTML與過(guò)濾鏈接的相關(guān)PHP函數(shù)使用解析
- php基于Snoopy解析網(wǎng)頁(yè)html的方法
- PHP抓取網(wǎng)頁(yè)、解析HTML常用的方法總結(jié)
- php實(shí)現(xiàn)的一個(gè)很好用HTML解析器類可用于采集數(shù)據(jù)
- 解析關(guān)于java,php以及html的所有文件編碼與亂碼的處理方法匯總
- 解析PHP生成靜態(tài)html文件的三種方法
- 用php解析html的實(shí)現(xiàn)代碼
- php使用simple_html_dom解析HTML示例
相關(guān)文章
php使用array_search函數(shù)實(shí)現(xiàn)數(shù)組查找的方法
這篇文章主要介紹了php使用array_search函數(shù)實(shí)現(xiàn)數(shù)組查找的方法,涉及php數(shù)組查找的相關(guān)技巧,需要的朋友可以參考下2015-06-06php + nginx項(xiàng)目中的權(quán)限詳解
這篇文章主要給大家介紹了關(guān)于php + nginx項(xiàng)目中權(quán)限的相關(guān)資料,文章介紹的非常詳細(xì),對(duì)大家具有一定的參考學(xué)習(xí)價(jià)值,需要的朋友們下面來(lái)一起看看吧。2017-05-05Windows2003 下 MySQL 數(shù)據(jù)庫(kù)每天自動(dòng)備份
Windows2003 下 MySQL 數(shù)據(jù)庫(kù)每天自動(dòng)備份...2006-12-12php 微信開(kāi)發(fā)獲取用戶信息如何實(shí)現(xiàn)
這篇文章主要介紹了php 微信開(kāi)發(fā)獲取用戶信息如何實(shí)現(xiàn)的相關(guān)資料,需要的朋友可以參考下2016-12-12ThinkPHP使用心得分享-上傳類UploadFile的使用
ThinkPHP中的UploadFile類用于處理文件上傳,本文小總結(jié)了一下關(guān)于學(xué)習(xí)過(guò)程中對(duì)UploadFile類的使用方法。2014-05-05