欧美bbbwbbbw肥妇,免费乱码人妻系列日韩,一级黄片

php使用自帶dom擴展進行元素匹配的原理解析

 更新時間:2020年05月29日 10:11:50   作者:夢回故里  
這篇文章主要介紹了php使用自帶dom擴展進行元素匹配的原理解析,本文通過實例代碼給大家介紹的非常詳細,對大家的學習或工作具有一定的參考借鑒價值,需要的朋友可以參考下

DOMDocument

php提供了非常好用的解析html和xml文檔的擴展庫DOM,使用這個庫可以非常高效的進行html和xml文檔的解析,它的原理就是通過尋找首尾匹配對來進行文檔的解析。

從上面的分析可以看出,如果首位不匹配,可能就會導致一些錯誤的出現(xiàn),因此,這個時候我們需要設置

libxml_use_internal_errors(true);

來進行錯誤的屏蔽,讓它可以解析整個文檔。

解析html基本用法

$dom = new \DOMDocument;
$content = htmlspecialchars_decode($content);
libxml_use_internal_errors(true);
$content = mb_convert_encoding($content, 'HTML-ENTITIES', 'UTF-8');
$dom->loadHTML($content);

$content是要解析的html字符串,其中我們對它進行了轉義,因為可能含有實體集,然后我們有進行了編碼的轉換,因為可能文檔不是utf-8格式的,會導致日文,法文等文字亂碼。

獲取元素

$a = $dom->getElementsByTagName('a');
$p = $dom->getElementsByTagName('p');

遍歷元素

$elements = $dom->getElementsByTagName('a');
foreach ($elements as $element) {
  $element->textContent = '替換成其它的文字';
}

通過上面的循環(huán),可以將全部a標簽的文字替換掉。

元素嵌套

有些時候,html會嵌套很多層,比如

<div>
<p>
<a href="xxx" rel="external nofollow" >我是文字</a>
</p>
<p>
內容替換
</p>
</div>

如果我們想要對p標簽文字進行替換的化,并且不想要替換含有子元素的內容,就是這里的a標簽不想替換,下面的語句不能夠解決我們的問題:

$elements = $dom->getElementsByTagName('p');
foreach ($elements as $element) {
  if($element->hasChildNodes()){
    $element->textContent = 'p標簽內容替換';
  }
}

上面的代會將a標簽的內容也替換掉,這不是我們想要的結果,因為hasChildNodes()這個函數(shù)表示的含有內容,無論它是標簽還是文字,它都是返回true的,除非它是空標簽,例如

它才會返回false.

所以我們需要自己封裝一個函數(shù)進行檢查是否含有嵌套標簽。

function hasChild($element, $tags)
{
  foreach($tags as $v){
  $elements = $element->getElementsByTagName($v);

  if($elements->length){
  return true;
  }

  }
  return false;
}
$tags = array('title','h1','h2','h3','h4','h5','a','p','dd','img');  

$elements = $dom->getElementsByTagName('p');
foreach ($elements as $element) {
  if(hasChild($element, $tags)){
    $element->textContent = 'p標簽內容替換';
  }
}

通過我們自己封裝的函數(shù),就可以判斷出$dom的node節(jié)點是否含有子標簽。

總結

到此這篇關于php使用自帶dom擴展進行元素匹配的文章就介紹到這了,更多相關php元素匹配內容請搜索腳本之家以前的文章或繼續(xù)瀏覽下面的相關文章希望大家以后多多支持腳本之家!

相關文章

  • PHP結合Mysql數(shù)據(jù)庫實現(xiàn)留言板功能

    PHP結合Mysql數(shù)據(jù)庫實現(xiàn)留言板功能

    這篇文章主要介紹了PHP結合Mysql數(shù)據(jù)庫實現(xiàn)留言板功能的相關資料,需要的朋友可以參考下
    2016-03-03
  • Drupal7中常用的數(shù)據(jù)庫操作實例

    Drupal7中常用的數(shù)據(jù)庫操作實例

    Drupal 7 提供的新功能其中一個就是可以使用 Query Builder and Query Objects 查詢生成器來構造查詢對象的能力,無需在代碼中寫原始的SQL語句,一是提高了代碼可閱讀性,二是兼容所有數(shù)據(jù)庫
    2014-03-03
  • ThinkPHP令牌驗證實例

    ThinkPHP令牌驗證實例

    ThinkPHP新版內置了表單令牌驗證功能,可以有效防止表單的遠程提交等安全防護。這篇文章主要介紹了ThinkPHP令牌驗證,需要的朋友可以參考下
    2014-06-06
  • 國產PHP開發(fā)框架myqee新手快速入門教程

    國產PHP開發(fā)框架myqee新手快速入門教程

    這篇文章主要介紹了國產PHP開發(fā)框架myqee新手快速入門教程,myqee中文名稱邁啟PHP框架,有比較多的高級開發(fā)特性,需要的朋友可以參考下
    2014-07-07
  • ThinkPHP5 的簡單搭建和使用詳解

    ThinkPHP5 的簡單搭建和使用詳解

    這篇文章主要介紹了ThinkPHP5 的簡單搭建和使用詳解,小編覺得挺不錯的,現(xiàn)在分享給大家,也給大家做個參考。一起跟隨小編過來看看吧
    2018-11-11
  • PHP連接MYSQL數(shù)據(jù)庫實例代碼

    PHP連接MYSQL數(shù)據(jù)庫實例代碼

    現(xiàn)在做的項目需要php連接mysql數(shù)據(jù)庫,雖然之前學過,但是現(xiàn)在基本上都給忘了,之后通過查找相關資料找到了解決方法,下面小編把具體方法分享在腳本之家平臺供大家學習
    2016-01-01
  • thinkphp3.2中實現(xiàn)phpexcel導出帶生成圖片示例

    thinkphp3.2中實現(xiàn)phpexcel導出帶生成圖片示例

    本篇文章主要介紹了thinkphp3.2中實現(xiàn)phpexcel導出帶生成圖片示例,小編覺得挺不錯的,現(xiàn)在分享給大家,也給大家做個參考。一起跟隨小編過來看看吧
    2017-02-02
  • Aliyun Linux 編譯安裝 php7.3 tengine2.3.2 mysql8.0 redis5的過程詳解

    Aliyun Linux 編譯安裝 php7.3 tengine2.3.2 mysql8.0 redis5的過程詳解

    這篇文章主要介紹了Aliyun Linux 編譯安裝 php7.3 tengine2.3.2 mysql8.0 redis5,本文給大家介紹的非常詳細,對大家的學習或工作具有一定的參考借鑒價值,需要的朋友可以參考下
    2020-10-10
  • php中curl和soap方式請求服務超時問題的解決

    php中curl和soap方式請求服務超時問題的解決

    本篇文章主要介紹了php中curl和soap方式請求服務超時問題的解決,小編覺得挺不錯的,現(xiàn)在分享給大家,也給大家做個參考。一起跟隨小編過來看看吧
    2018-06-06
  • laravel join關聯(lián)查詢代碼實例

    laravel join關聯(lián)查詢代碼實例

    這篇文章主要介紹了laravel join關聯(lián)查詢代碼實例,join聯(lián)查是寫sql查詢的時候常用也是高效的一種查詢,文中是結合laravel框架來使用聯(lián)查,有感興趣的同學可以學習下
    2021-03-03

最新評論