欧美bbbwbbbw肥妇,免费乱码人妻系列日韩,一级黄片

PHP使用puppeteer抓取JS渲染后的頁面內(nèi)容

 更新時(shí)間:2025年02月02日 15:32:17   作者:SoCai  
最近遇到一個(gè)問題,需要爬取js渲染后的網(wǎng)頁內(nèi)容,因此研究了下相關(guān)實(shí)現(xiàn)方式,主要借助puppeteer實(shí)現(xiàn),它是一個(gè)Node庫,要想在PHP中使用,還借助了spatie/browsershot

最近遇到一個(gè)問題,需要爬取js渲染后的網(wǎng)頁內(nèi)容,因此研究了下相關(guān)實(shí)現(xiàn)方式。主要借助puppeteer實(shí)現(xiàn),它是一個(gè)Node庫,要想在PHP中使用,還借助了spatie/browsershot

環(huán)境依賴

環(huán)境要求
Node>=7.6.0
PHP>=7.1
PHP extensionphp_sockets, php_exif

puppeteer

Puppeteer是一個(gè)Node庫,我是直接在php項(xiàng)目下使用npm安裝這個(gè)庫,然后借助spatie/browsershot來調(diào)用它。讀者也可以新建一個(gè)node項(xiàng)目安裝這個(gè)庫,然后對(duì)外暴漏一個(gè)端口通過接口的方式傳遞url返回html內(nèi)容的方式實(shí)現(xiàn)。

npm i puppeteer --save

離線安裝Chromium

安裝puppeteer時(shí)會(huì)下載Chromium,因?yàn)楸娝苤脑蚩赡軙?huì)下載不下來,因此下面提供了離線下載的方式。

跳過安裝chromium

如果已經(jīng)運(yùn)行上一步的命令并且正在下載Chromium了,那可以直接Ctrl+C停止任務(wù)。如果還沒運(yùn)行,就使用下面的命令安裝。

npm i puppeteer --ignore-scripts

獲取需要下載的chromium版本號(hào)

打開/node_modules/puppeteer/package.json搜索chromium_revision對(duì)應(yīng)的版本號(hào)

"puppeteer": {
    "chromium_revision": "756035",
    "firefox_revision": "latest"
}

下載對(duì)應(yīng)版本的chromium

用上面的版本號(hào)替換掉下方花括號(hào)里的字符,比如我本地是win x64,下載地址就是https://commondatastorage.googleapis.com/chromium-browser-snapshots/Win_x64/756035/chrome-win.zip

mac版下載地址:
https://commondatastorage.googleapis.com/chromium-browser-snapshots/Mac/{chromium版本}/chrome-mac.zip

windows 64位版本下載地址:
https://commondatastorage.googleapis.com/chromium-browser-snapshots/Win_x64/{chromium版本}/chrome-win.zip

windows 32位版本下載地址:
https://commondatastorage.googleapis.com/chromium-browser-snapshots/Win/{chromium版本}/chrome-win.zip

Linux X86版本下載地址:
https://commondatastorage.googleapis.com/chromium-browser-snapshots/Linux/{chromium版本}/chrome-linux.zip

Linux X64版本下載地址:
https://commondatastorage.googleapis.com/chromium-browser-snapshots/Linux_x64/{chromium版本}/chrome-linux.zip

解壓

將下載下來的chromium安裝包解壓到puppeteer中的.local_chromium/win64-{chromium版本號(hào)}/目錄下。以我的為例就是/node_modules/puppeteer/.local_chromium/win64-756035/chrome-win/。搞定~

spatie/browsershot

browsershot 是一個(gè)composer包,以前還用過的spatie/laravel-permission,都是同一團(tuán)隊(duì)制作的

composer require spatie/browsershot

使用

其實(shí)困難的部分就是找到合適的工具以及安裝工具,真正使用反而很簡(jiǎn)單。下面列了一個(gè)很簡(jiǎn)單的例子,更多方法還是去看官方文檔吧。

<?php
use Spatie\Browsershot\Browsershot;
class Spider
{
    /**
     * 獲取html內(nèi)容
     * @param $url
     * @return string
     */
    public static function getBodyHtml($url)
    {
        return Browsershot::url($url)->bodyHtml();
    }
}

 總結(jié)

到此這篇關(guān)于PHP使用puppeteer抓取JS渲染后的頁面內(nèi)容的文章就介紹到這了,更多相關(guān)PHP獲取JS渲染后的頁面內(nèi)容內(nèi)容請(qǐng)搜索腳本之家以前的文章或繼續(xù)瀏覽下面的相關(guān)文章希望大家以后多多支持腳本之家!

相關(guān)文章

  • PHP登錄驗(yàn)證碼的實(shí)現(xiàn)與使用方法

    PHP登錄驗(yàn)證碼的實(shí)現(xiàn)與使用方法

    這篇文章主要介紹了PHP登錄驗(yàn)證碼的實(shí)現(xiàn)與使用方法,結(jié)合實(shí)例形式較為詳細(xì)的分析了php驗(yàn)證碼圖片的生成、顯示、判斷等相關(guān)步驟與使用技巧,需要的朋友可以參考下
    2016-07-07
  • 如何解決php domdocument找不到的問題

    如何解決php domdocument找不到的問題

    在本篇文章里小編給大家整理的是一篇關(guān)于php domdocument找不到的解決辦法,有需要的朋友們可以跟著學(xué)習(xí)參考下。
    2021-07-07
  • PHP樹形結(jié)構(gòu)tree類用法示例

    PHP樹形結(jié)構(gòu)tree類用法示例

    這篇文章主要介紹了PHP樹形結(jié)構(gòu)tree類用法,結(jié)合實(shí)例形式分析了php無限分類樹tree.class.php的定義及使用相關(guān)操作技巧,需要的朋友可以參考下
    2019-02-02
  • PHP實(shí)現(xiàn)事件機(jī)制實(shí)例分析

    PHP實(shí)現(xiàn)事件機(jī)制實(shí)例分析

    這篇文章主要介紹了PHP實(shí)現(xiàn)事件機(jī)制的方法,實(shí)例分析了事件機(jī)制的原理與php的相關(guān)實(shí)現(xiàn)技巧,需要的朋友可以參考下
    2015-06-06
  • php常用數(shù)學(xué)函數(shù)匯總

    php常用數(shù)學(xué)函數(shù)匯總

    這篇文章主要介紹了php常用數(shù)學(xué)函數(shù),以實(shí)例形式匯總了常用數(shù)學(xué)函數(shù)的定義及用法實(shí)例,具有不錯(cuò)的學(xué)習(xí)與借鑒價(jià)值,需要的朋友可以參考下
    2014-11-11
  • PHP 匿名函數(shù)與注意事項(xiàng)詳細(xì)介紹

    PHP 匿名函數(shù)與注意事項(xiàng)詳細(xì)介紹

    這篇文章主要介紹了PHP 匿名函數(shù)與注意事項(xiàng)詳細(xì)介紹的相關(guān)資料,匿名函數(shù)是PHP5.3引進(jìn)來了,php5.3不但引進(jìn)了匿名函數(shù)還有更多更好多新的特性了,下面我們一起來了解一下PHP匿名函數(shù)與注意事項(xiàng)詳解,需要的朋友可以參考下
    2016-11-11
  • PHP寫日志的實(shí)現(xiàn)方法

    PHP寫日志的實(shí)現(xiàn)方法

    這篇文章主要介紹了PHP寫日志的實(shí)現(xiàn)方法,是PHP程序設(shè)計(jì)中比較實(shí)用的技巧,需要的朋友可以參考下
    2014-11-11
  • PHP實(shí)現(xiàn)隨機(jī)發(fā)放撲克牌

    PHP實(shí)現(xiàn)隨機(jī)發(fā)放撲克牌

    這篇文章主要為大家詳細(xì)介紹了PHP實(shí)現(xiàn)隨機(jī)發(fā)放撲克牌,文中示例代碼介紹的非常詳細(xì),具有一定的參考價(jià)值,感興趣的小伙伴們可以參考一下
    2020-04-04
  • php+MySql實(shí)現(xiàn)登錄系統(tǒng)與輸出瀏覽者信息功能

    php+MySql實(shí)現(xiàn)登錄系統(tǒng)與輸出瀏覽者信息功能

    這篇文章主要介紹了php+MySql實(shí)現(xiàn)登錄系統(tǒng)與輸出瀏覽者信息功能 的相關(guān)資料,需要的朋友可以參考下
    2016-07-07
  • zend framework配置操作數(shù)據(jù)庫實(shí)例分析

    zend framework配置操作數(shù)據(jù)庫實(shí)例分析

    zend framework項(xiàng)目建立后,看了下zend framework配置操作數(shù)據(jù)庫,本文將詳細(xì)介紹,需要了解的朋友可以參考下
    2012-12-12

最新評(píng)論