欧美bbbwbbbw肥妇,免费乱码人妻系列日韩,一级黄片

python 將html轉(zhuǎn)換為pdf的幾種方法

 更新時(shí)間:2020年12月29日 09:05:10   作者:州的先生  
這篇文章主要介紹了python 將html轉(zhuǎn)換為pdf的幾種方法,幫助大家更好的理解和使用python,感興趣的朋友可以了解下

將 HTML 網(wǎng)頁(yè)轉(zhuǎn)換為 PDF 是很多人常見(jiàn)的一個(gè)需求,在瀏覽器上,我們可以通過(guò)瀏覽器的“打印”功能直接將網(wǎng)頁(yè)打印輸出為 PDF。

但是如果有多個(gè)網(wǎng)頁(yè)就不好辦了。

二進(jìn)制軟件

網(wǎng)絡(luò)上存在很多將 HTML 轉(zhuǎn)換為 PDF 的軟件和工具。比較著名的有 Carelib、wkhtmltopdf。

whtmltopdf

wkhtmltopdf 真是一個(gè)優(yōu)秀的 HTML 轉(zhuǎn)換 PDF 工具。其借助 Qt 的 WebKit 渲染引擎,將 HTML 文檔渲染導(dǎo)出為 PDF 文檔或圖像。

功能十分完善,但是由于使用的渲染引擎是 Qt 的 WebKit,其沒(méi)法對(duì) ES6 的 JavaScript 代碼提供支持,導(dǎo)致一些采用 ES6 編寫(xiě)的 HTML 頁(yè)面渲染不出實(shí)際的效果來(lái),導(dǎo)致州的先生最終放棄了它。

Carelib

Carelib 是一個(gè)電子書(shū)管理軟件,其中提供了各類文檔的轉(zhuǎn)換工具,所以可以借助其電子書(shū)轉(zhuǎn)換工具來(lái)實(shí)現(xiàn) HTMl 到 PDF 的轉(zhuǎn)換。

這些都是用于桌面環(huán)境的二進(jìn)制軟件,如果要在 Python 中使用,要么使用 Popen() 方法調(diào)用這些二進(jìn)制軟件的命令,要么使用一些第三方的封裝模塊,比如:pdfkit、pypandoc 等,這些第三方模塊通過(guò)集成調(diào)用上述二進(jìn)制軟件,封裝了一些方便 Python 調(diào)用的接口。

純 Python 庫(kù)實(shí)現(xiàn)

上面介紹的那些 Python 第三方模塊雖然可以很好的進(jìn)行 HTML 到 PDF 的轉(zhuǎn)換工作,但是都需要額外在計(jì)算機(jī)上安裝其他的二進(jìn)制軟件,很多小伙伴并不喜歡這種調(diào)用方式。

不依賴于二進(jìn)制軟件的實(shí)現(xiàn),有如下的方案:

xhtml2pdf

這是一個(gè)基于 ReportLab、html5lib、PyPDF2 等 Python 模塊構(gòu)建的 HTML 到 PDF 轉(zhuǎn)換模塊。能夠很好的支持 HTML5 、CSS2.1 和部分 CSS3 語(yǔ)法。

因?yàn)槭腔?Report Lab 模塊進(jìn)行的開(kāi)發(fā),其對(duì)中文的支持在某些環(huán)境下會(huì)有問(wèn)題。而且由于開(kāi)發(fā)人員的變更,模塊的功能出現(xiàn)了一些斷層。但是仍然是一個(gè)非常棒的 HTML 轉(zhuǎn) PDF 模塊。

weasyprint

這是一個(gè)用于 HTML 和 CSS 的可視化渲染引擎,可以將 HTML 文檔導(dǎo)出為打印標(biāo)準(zhǔn)的 PDF 文件。

xhtml2pdf 模塊也曾推薦使用這個(gè)模塊來(lái)進(jìn)行 HTML 轉(zhuǎn)換 PDF 的工作。

這個(gè)模塊功能很強(qiáng)大、效果很出色,但是,模塊的依賴項(xiàng)太多了:

州的先生至今沒(méi)有在 Windows 電腦上安裝成功過(guò)!

瀏覽器方案

在上述兩種方案中,二進(jìn)制程序的可控制性稍有不足,而純 Python 實(shí)現(xiàn)的渲染解析則在功能上和依賴上不是有友好。

處理上述兩種方案,我們還能采用第三種方式進(jìn)行 HTMl 到 PDF 的轉(zhuǎn)換。那就是借助 Web 自動(dòng)化測(cè)試的瀏覽器內(nèi)核和 Qt for Python 的 Web 引擎 來(lái)實(shí)現(xiàn)。

Web 自動(dòng)化的瀏覽器內(nèi)核

使用 Python 的小伙伴經(jīng)常會(huì)使用 Selenium、pyppeteer 這兩個(gè) Web 自動(dòng)化測(cè)試的模塊來(lái)進(jìn)行數(shù)據(jù)采集和 Web 自動(dòng)化測(cè)試工作。

這兩個(gè)模塊都是用來(lái)驅(qū)動(dòng)一個(gè)真實(shí)的瀏覽器來(lái)進(jìn)行網(wǎng)頁(yè)的操作。正是基于此,我們可以調(diào)用瀏覽器中打印相關(guān)的 API 接口,來(lái)實(shí)現(xiàn) HTML 轉(zhuǎn) PDF 的功能。

例如,在 pyppeteer 中可以按照下面示例的方式,打開(kāi)一個(gè) HTML 文檔,然后將其轉(zhuǎn)換為 PDF 文檔:

Qt 的 Web 引擎

在 Qt5 中,Qt 使用新的 Chromium 內(nèi)核代替了老舊的 WebKit 作為 Web 的渲染引擎。使得在 Qt 中進(jìn)行可以現(xiàn)代化的瀏覽器開(kāi)發(fā)。

借助于 Qt 的 Python 實(shí)現(xiàn)(PyQt5 系列 和 PySide2 系列),我們可以直接調(diào)用 Qt 中的 Web 引擎相關(guān)的接口。

其中 QtWebEngineWidgets 子模塊中的 QWebEngineView() 類提供了 printToPdf 方法供我們將網(wǎng)頁(yè)打印為 PDF 文檔,所以基于此,我們也可以使用 PyQt5 或 PySide2 進(jìn)行 HTML 轉(zhuǎn)換 PDF,示例如下所示:

最后

在上面,州的先生介紹了 3 種在 Python 中轉(zhuǎn)換 HTML 文檔為 PDF 文檔的方案,每種方案都有各自的優(yōu)勢(shì)和不足,正確地評(píng)估自己的需求然后選擇合適的方案,也能彌補(bǔ)其不足。

以上就是python 將html轉(zhuǎn)換為pdf的幾種方法的詳細(xì)內(nèi)容,更多關(guān)于python 將html轉(zhuǎn)換為pdf的資料請(qǐng)關(guān)注腳本之家其它相關(guān)文章!

相關(guān)文章

  • python中的annotate函數(shù)使用

    python中的annotate函數(shù)使用

    這篇文章主要介紹了python中的annotate函數(shù)使用方式,具有很好的參考價(jià)值,希望對(duì)大家有所幫助。如有錯(cuò)誤或未考慮完全的地方,望不吝賜教
    2022-05-05
  • python多線程與多進(jìn)程及其區(qū)別詳解

    python多線程與多進(jìn)程及其區(qū)別詳解

    這篇文章主要介紹了python多線程與多進(jìn)程及其區(qū)別詳解,文中通過(guò)示例代碼介紹的非常詳細(xì),對(duì)大家的學(xué)習(xí)或者工作具有一定的參考學(xué)習(xí)價(jià)值,需要的朋友可以參考下
    2019-08-08
  • 記一次python 爬蟲(chóng)爬取深圳租房信息的過(guò)程及遇到的問(wèn)題

    記一次python 爬蟲(chóng)爬取深圳租房信息的過(guò)程及遇到的問(wèn)題

    這篇文章主要介紹了記一次python 爬蟲(chóng)爬取深圳租房信息的過(guò)程,幫助大家更好的理解和學(xué)習(xí)python爬蟲(chóng),感興趣的朋友可以了解下
    2020-11-11
  • 關(guān)于Python兩個(gè)列表進(jìn)行全組合操作的三種方式

    關(guān)于Python兩個(gè)列表進(jìn)行全組合操作的三種方式

    這篇文章主要介紹了關(guān)于Python兩個(gè)列表進(jìn)行全組合操作的三種方式,兩個(gè)元組 (a, b)(c, d),則它們的組合有 a,c a,d b,c b,d,這就叫全組合,需要的朋友可以參考下
    2023-04-04
  • Windows下Python3.6安裝第三方模塊的方法

    Windows下Python3.6安裝第三方模塊的方法

    這篇文章主要介紹了Windows下Python3.6安裝第三方模塊的方法,需要的朋友可以參考下
    2018-11-11
  • 關(guān)于python中不同函數(shù)讀取圖片格式的區(qū)別淺析

    關(guān)于python中不同函數(shù)讀取圖片格式的區(qū)別淺析

    這篇文章主要給大家介紹了關(guān)于python中不同函數(shù)讀取圖片格式的區(qū)別,文中通過(guò)實(shí)例代碼介紹的非常詳細(xì),對(duì)大家的學(xué)習(xí)或者工作具有一定的參考學(xué)習(xí)價(jià)值,需要的朋友可以參考下
    2022-03-03
  • 解決Python調(diào)用df.to_csv()出現(xiàn)中文亂碼的問(wèn)題

    解決Python調(diào)用df.to_csv()出現(xiàn)中文亂碼的問(wèn)題

    在Python使用df.to_csv()時(shí),若出現(xiàn)中文亂碼,可通過(guò)加入?yún)?shù)encoding="utf_8_sig"解決,"utf-8"編碼不包含BOM,直接處理文件時(shí)會(huì)將BOM誤讀為內(nèi)容;而"utf_8_sig"會(huì)識(shí)別并處理BOM,避免亂碼,此方法為實(shí)踐經(jīng)驗(yàn),供參考
    2024-09-09
  • python tkinter GUI繪制,以及點(diǎn)擊更新顯示圖片代碼

    python tkinter GUI繪制,以及點(diǎn)擊更新顯示圖片代碼

    這篇文章主要介紹了python tkinter GUI繪制,以及點(diǎn)擊更新顯示圖片代碼,具有很好的參考價(jià)值,希望對(duì)大家有所幫助。一起跟隨小編過(guò)來(lái)看看吧
    2020-03-03
  • opencv+python實(shí)現(xiàn)圖像矯正

    opencv+python實(shí)現(xiàn)圖像矯正

    這篇文章主要為大家詳細(xì)介紹了opencv+python實(shí)現(xiàn)圖像矯正,文中示例代碼介紹的非常詳細(xì),具有一定的參考價(jià)值,感興趣的小伙伴們可以參考一下
    2022-08-08
  • Python爬蟲(chóng)基本庫(kù)request的基本使用

    Python爬蟲(chóng)基本庫(kù)request的基本使用

    這篇文章主要介紹了Python爬蟲(chóng)基本庫(kù)request的基本使用,urllib庫(kù)使用繁瑣,比如處理網(wǎng)頁(yè)驗(yàn)證和Cookies時(shí),需要編寫(xiě)Opener和Handler來(lái)處理。為了更加方便的實(shí)現(xiàn)這些操作,就有了更為強(qiáng)大的requests庫(kù),需要的朋友可以參考下
    2023-07-07

最新評(píng)論