欧美bbbwbbbw肥妇,免费乱码人妻系列日韩,一级黄片

基于Python輕松實現PDF轉圖片

 更新時間:2023年08月29日 14:08:44   作者:編程啟航  
PDF文件是我們在日常工作和學習中常用的文檔格式之一,但你知道嗎,你可以將PDF文件轉換為圖像,讓文檔變得更加生動有趣,下面我們就來看看具體的實現方法吧

導語

PDF文件是我們在日常工作和學習中常用的文檔格式之一,但你知道嗎?你可以將PDF文件轉換為圖像,讓文檔變得更加生動有趣?;蛘呤欠乐箘e人對你文檔的復制粘貼。

本篇博客將為你詳細介紹如何將PDF轉換為圖像,開啟全新的文檔閱讀體驗。

什么是PDF轉圖像

PDF轉圖像是一種將PDF文件的每一頁內容轉換為圖像格式(如PNG、JPEG等)的處理方式。通過這種方式,你可以將靜態(tài)的文檔內容轉化為生動的圖像,防止別人對文字文檔的復制粘貼,更易于與他人分享和呈現。

如何實現pdf轉圖像

使用pdf2image庫

使用Python的pdf2image庫,我們可以輕松實現PDF到圖像的轉換。

但需要注意的是:pdf2image 基于poppler-utils工具,它使用pdftoppm工具將PDF頁面轉換為圖像。因此,在使用pdf2image之前,你需要確保已經安裝了poppler-utils。

from pdf2image import convert_from_path
def pdf_to_images(pdf_path, output_folder):
    pages = convert_from_path(pdf_path)
    for i, page in enumerate(pages):
        page.save(f'{output_folder}/page_{i + 1}.png', 'PNG')
pdf_path = 'your_pdf_file.pdf'
output_folder = 'output_images'
pdf_to_images(pdf_path, output_folder)

使用PyMuPDF庫進行PDF轉圖像

另一個強大的工具是PyMuPDF庫,它允許我們更加靈活地操作PDF并轉換為圖像。

具體版如下:

import datetime
import os
import fitz  # fitz就是pip install PyMuPDF
def pyMuPDF_fitz(pdfPath, imagePath):
    startTime_pdf2img = datetime.datetime.now()  # 開始時間
    print("imagePath=" + imagePath)
    pdfDoc = fitz.open(pdfPath)
    for pg in range(pdfDoc.pageCount):
        page = pdfDoc[pg]
        rotate = int(0)
        # 每個尺寸的縮放系數為1.3,這將為我們生成分辨率提高2.6的圖像。
        # 此處若是不做設置,默認圖片大小為:792X612, dpi=96
        zoom_x = 2  # (1.33333333-->1056x816)   (2-->1584x1224)
        zoom_y = 2
        mat = fitz.Matrix(zoom_x, zoom_y).preRotate(rotate)
        pix = page.getPixmap(matrix=mat, alpha=False)
        if not os.path.exists(imagePath):  # 判斷存放圖片的文件夾是否存在
            os.makedirs(imagePath)  # 若圖片文件夾不存在就創(chuàng)建
        pix.writePNG(imagePath + '/' + 'images_%s.png' % pg)  # 將圖片寫入指定的文件夾內
    endTime_pdf2img = datetime.datetime.now()  # 結束時間
    print('pdf2img時間=', (endTime_pdf2img - startTime_pdf2img).seconds)
if __name__ == "__main__":
    # 1、PDF地址
    pdfPath = r'../demo-scan.pdf'
    # 2、需要儲存圖片的目錄
    imagePath = './imgs'
    pyMuPDF_fitz(pdfPath, imagePath)

簡化版如下:

import fitz
def pdf_to_images(pdf_path, output_folder):
    pdf_document = fitz.open(pdf_path)
    for pg in range(pdf_document.page_count):
        page = pdf_document[pg]
        pix = page.get_pixmap(matrix=fitz.Matrix(2, 2))
        pix.save(f'{output_folder}/page_{pg + 1}.png')
pdf_path = 'your_pdf_file.pdf'
output_folder = 'output_images'
pdf_to_images(pdf_path, output_folder)

開啟全新閱讀體驗

通過將PDF轉換為圖像,你可以在不同場景下獲得更好的閱讀體驗。你可以將圖像用于演示、分享到社交媒體,甚至用于個人學習筆記。

也可以防止別人直接復制你的成果。

兩種方式對比

pdf2imagefitz(來自PyMuPDF庫)都是用于在Python中處理PDF文件的工具。它們在功能和用法上有一些區(qū)別,以下是它們的主要區(qū)別和比較:

pdf2image:

功能特點:

pdf2image 是一個用于將PDF文件的頁面轉換為圖像的Python庫。它專注于將PDF頁面轉換為圖像格式(如PNG、JPEG等),便于在其他應用中使用,如圖像處理、OCR等。

依賴庫:

pdf2image 基于poppler-utils工具,它使用pdftoppm工具將PDF頁面轉換為圖像。因此,在使用pdf2image之前,你需要確保已經安裝了poppler-utils。

使用簡單:

pdf2image 提供了直觀的API,易于使用。它可以從PDF文件中提取指定頁面并將其轉換為圖像,非常適合基本的PDF轉圖像需求。

示例代碼:

from pdf2image import convert_from_path
images = convert_from_path('input.pdf')
for i, image in enumerate(images):
    image.save(f'page_{i + 1}.png', 'PNG')

fitz(PyMuPDF庫):

功能特點:

fitzPyMuPDF 庫的一部分,它是一個功能豐富的PDF處理庫,支持閱讀、編輯和轉換PDF文檔。除了轉換為圖像,fitz 還提供了許多其他PDF操作的功能,如文本提取、標注等。

獨立性:

fitzPyMuPDF 庫的一部分,它不需要依賴外部工具。這使得在沒有安裝poppler-utils的情況下,仍然可以使用 fitz 進行PDF操作。

更多靈活性:

fitz 不僅可以將PDF頁面轉換為圖像,還可以對PDF文檔進行更復雜的操作,如獲取頁面信息、文本提取、頁面合并、旋轉、裁剪等。因此,如果你需要更多關于PDF的操作,fitz 是一個更強大的選擇。

示例代碼:

import fitz
pdf_document = fitz.open('input.pdf')
page = pdf_document[0]
pix = page.get_pixmap(matrix=fitz.Matrix(2, 2))
pix.save('page_1.png')
pdf_document.close()

綜上所述,如果你只需要將PDF頁面轉換為圖像,pdf2image 是一個更簡單的選擇。而如果你需要更多PDF操作的靈活性,如文本提取、標注等,那么fitz(PyMuPDF)提供了更廣泛的功能。選擇合適的工具取決于你的具體需求。

到此這篇關于基于Python輕松實現PDF轉圖片的文章就介紹到這了,更多相關Python PDF轉圖片內容請搜索腳本之家以前的文章或繼續(xù)瀏覽下面的相關文章希望大家以后多多支持腳本之家!

相關文章

  • 用python按照圖像灰度值統計并篩選圖片的操作(PIL,shutil,os)

    用python按照圖像灰度值統計并篩選圖片的操作(PIL,shutil,os)

    這篇文章主要介紹了用python按照圖像灰度值統計并篩選圖片的操作(PIL,shutil,os),具有很好的參考價值,希望對大家有所幫助。一起跟隨小編過來看看吧
    2020-06-06
  • python爬蟲之xpath的基本使用詳解

    python爬蟲之xpath的基本使用詳解

    本篇文章主要介紹了python爬蟲之xpath的基本使用詳解,小編覺得挺不錯的,現在分享給大家,也給大家做個參考。一起跟隨小編過來看看吧
    2018-04-04
  • Python語法學習之進程的創(chuàng)建與常用方法詳解

    Python語法學習之進程的創(chuàng)建與常用方法詳解

    本文我們將學習一下在?Python?中去創(chuàng)建并使用多進程的方法,可以通過創(chuàng)建多個進程來幫助我們提高腳本執(zhí)行的效率,感興趣的可以了解一下
    2022-04-04
  • Python實現滑動平均(Moving Average)的例子

    Python實現滑動平均(Moving Average)的例子

    今天小編就為大家分享一篇Python實現滑動平均(Moving Average)的例子,具有很好的參考價值,希望對大家有所幫助。一起跟隨小編過來看看吧
    2019-08-08
  • Python地圖繪制實操詳解

    Python地圖繪制實操詳解

    在本文里我們給大家介紹了用Python繪制地圖的知識點以及詳細步驟,需要的朋友們跟著學習下。
    2019-03-03
  • Python中six模塊基礎用法

    Python中six模塊基礎用法

    在本篇文章里小編給大家分享的是關于Python中six模塊基礎用法以及相關知識點,需要的朋友們學習下。
    2019-12-12
  • 簡單了解Django ORM常用字段類型及參數配置

    簡單了解Django ORM常用字段類型及參數配置

    這篇文章主要介紹了簡單了解Django ORM常用字段類型及參數配置,文中通過示例代碼介紹的非常詳細,對大家的學習或者工作具有一定的參考學習價值,需要的朋友可以參考下
    2020-01-01
  • Python Word文件自動化實戰(zhàn)之簡歷篩選

    Python Word文件自動化實戰(zhàn)之簡歷篩選

    本文將利用Python自動化做一個具有實操性的小練習,即通過讀取簡歷來篩選出符合招聘條件的簡歷。文中的示例代碼講解詳細,感興趣的小伙伴可以跟隨小編一起學習一下
    2022-05-05
  • Python實現簡單狀態(tài)框架的方法

    Python實現簡單狀態(tài)框架的方法

    這篇文章主要介紹了Python實現簡單狀態(tài)框架的方法,涉及Python狀態(tài)框架的實現技巧,具有一定參考借鑒價值,需要的朋友可以參考下
    2015-03-03
  • Python異常處理知識點總結

    Python異常處理知識點總結

    在本篇文章中小編給大家分享了關于Python異常處理的相關知識點以及對應的實例內容,需要的朋友們學習下。
    2019-02-02

最新評論