快捷導(dǎo)航

Python使用PyPDF2操作PDF的詳細(xì)教程

更新時(shí)間：2025年02月28日 09:44:46 作者：morris131

PyPDF2是一個(gè)用于處理PDF文件的Python庫(kù),可以讀取、合并、拆分、裁剪和修改PDF文件,以下是一些使用PyPDF2的基本示例,包括如何安裝該庫(kù)以及執(zhí)行一些常見(jiàn)的PDF操作,需要的朋友可以參考下

安裝PyPDF2

首先，你需要安裝PyPDF2庫(kù)。你可以使用pip來(lái)安裝它：

pip install PyPDF2

讀取PDF文件

讀取PDF文件并打印其頁(yè)數(shù)：

import PyPDF2

# 使用PyPDF2讀取pdf文件
if __name__ == '__main__':
    # 打開(kāi) PDF 文件
    with open('example.pdf', 'rb') as file:
        # 創(chuàng)建一個(gè) PDF 閱讀器對(duì)象
        reader = PyPDF2.PdfReader(file)

        # 打印 PDF 文件中的頁(yè)數(shù)
        print(f'Number of pages: {len(reader.pages)}')

提取文本

從PDF文件中提取文本：

import PyPDF2

# 使用PyPDF2讀取pdf文本
if __name__ == '__main__':
    # 打開(kāi) PDF 文件
    with open('example.pdf', 'rb') as file:
        # 創(chuàng)建一個(gè) PDF 閱讀器對(duì)象
        reader = PyPDF2.PdfReader(file)

        # 提取第一頁(yè)的文本
        page = reader.pages[0]
        text = page.extract_text()

        print(text)

拆分PDF文件

將PDF文件拆分為兩個(gè)文件，一個(gè)文件包含奇數(shù)頁(yè)，一個(gè)文件包含偶數(shù)頁(yè)：

import PyPDF2

# 使用PyPDF2將PDF文件拆分為兩個(gè)文件，一個(gè)文件包含奇數(shù)頁(yè)，一個(gè)文件包含偶數(shù)頁(yè)：
if __name__ == '__main__':
    # 創(chuàng)建一個(gè) PDF 寫入器對(duì)象
    odd_writer = PyPDF2.PdfWriter()
    even_writer = PyPDF2.PdfWriter()

    # 打開(kāi)要拆分的 PDF 文件
    with open('example.pdf', 'rb') as file:
        reader = PyPDF2.PdfReader(file)

        page_num = 0
        for page in reader.pages:
            # print(page_num)
            if page_num % 2 == 0:
                # print(reader.pages[page_num])
                odd_writer.add_page(page)
            else:
                even_writer.add_page(page)
            page_num = page_num+1

        # 將拆分后的 PDF 寫入到一個(gè)新文件
        with open('example1.pdf', 'wb') as output_pdf:
            odd_writer.write(output_pdf)

        # 將拆分后的 PDF 寫入到一個(gè)新文件
        with open('example2.pdf', 'wb') as output_pdf:
            even_writer.write(output_pdf)

合并PDF文件

你可以將多個(gè)PDF文件合并為一個(gè)：

import PyPDF2

# 使用PyPDF2合并兩個(gè)pdf文件
if __name__ == '__main__':
    # 打開(kāi)要合并的 PDF 文件
    pdf_files = ['example1.pdf', 'example2.pdf']

    # 創(chuàng)建一個(gè) PDF 寫入器對(duì)象
    merger = PyPDF2.PdfMerger()

    for pdf_file in pdf_files:
        merger.append(pdf_file)

    # 將合并后的 PDF 寫入到一個(gè)新文件
    with open('merged.pdf', 'wb') as output_pdf:
        merger.write(output_pdf)

裁剪PDF頁(yè)面

PyPDF2并不直接支持裁剪頁(yè)面，但你可以通過(guò)提取頁(yè)面的部分內(nèi)容并創(chuàng)建一個(gè)新的頁(yè)面來(lái)實(shí)現(xiàn)這一功能。以下是一個(gè)簡(jiǎn)單的示例，演示如何裁剪頁(yè)面的上半部分：

import PyPDF2

# 使用PyPDF2裁剪PDF頁(yè)面，通過(guò)提取頁(yè)面的部分內(nèi)容并創(chuàng)建一個(gè)新的頁(yè)面來(lái)實(shí)現(xiàn)這一功能
if __name__ == '__main__':
    # 打開(kāi) PDF 文件
    with open('example.pdf', 'rb') as file:
        reader = PyPDF2.PdfReader(file)

        # 創(chuàng)建一個(gè) PDF 寫入器對(duì)象
        writer = PyPDF2.PdfWriter()

        # 獲取第一頁(yè)
        page = reader.pages[0]

        # 定義裁剪區(qū)域（左下角和右上角的坐標(biāo)）
        # 表示裁剪區(qū)域的左下角和右上角坐標(biāo)
        cropbox = page.cropbox
        x_lower_left = cropbox.lower_left[0]
        y_lower_left = cropbox.lower_left[1] + (cropbox.upper_right[1] - cropbox.lower_left[1]) / 2
        x_upper_right = cropbox.upper_right[0]
        y_upper_right = cropbox.upper_right[1]

        # 設(shè)置裁剪區(qū)域（左下x, 左下y, 右上x(chóng), 右上y）
        page.cropbox.lower_left = (x_lower_left, y_lower_left)
        page.cropbox.upper_right = (x_upper_right, y_upper_right)
        writer.add_page(page)

        # 將裁剪后的 PDF 寫入到一個(gè)新文件
        with open('cropped_example.pdf', 'wb') as output_pdf:
            writer.write(output_pdf)

加密PDF

from PyPDF2 import PdfWriter
from PyPDF2 import PdfReader

# 使用PyPDF2加密pdf
if __name__ == '__main__':
    writer = PdfWriter()
    with open('example.pdf', 'rb') as file:
        reader = PdfReader(file)
        writer.add_page(reader.pages[0])

    # 設(shè)置加密（128位 AES）
    writer.encrypt(
        user_password="password123",
        owner_password=None,
        use_128bit=True
    )

    with open("encrypted.pdf", "wb") as out_file:
        writer.write(out_file)

到此這篇關(guān)于Python使用PyPDF2操作PDF的詳細(xì)教程的文章就介紹到這了,更多相關(guān)Python PyPDF2操作PDF內(nèi)容請(qǐng)搜索腳本之家以前的文章或繼續(xù)瀏覽下面的相關(guān)文章希望大家以后多多支持腳本之家！

您可能感興趣的文章: