欧美bbbwbbbw肥妇,免费乱码人妻系列日韩,一级黄片

python 處理pdf加密文件的操作代碼

 更新時間:2024年01月12日 09:24:31   作者:凍雨冷霧  
這篇文章主要介紹了python 處理pdf加密文件的操作代碼,本文通過實例代碼給大家介紹的非常詳細,對大家的學(xué)習(xí)或工作具有一定的參考借鑒價值,需要的朋友參考下吧

近期有同事需要提取加密的pdf文件,截取其中的信息,并且重構(gòu)pdf文件。網(wǎng)上沒有搜到相關(guān)的pdf操作,于是咨詢了chatgpt,給出了pypdf2的使用案例。但是時間比較久遠了,很多庫內(nèi)的調(diào)用接口都已經(jīng)更新了。

于是自行到官方的庫內(nèi)學(xué)習(xí)相關(guān)接口使用。整理的處理代碼如下:

# -*- coding: utf-8 -*-
"""
Created on Thu Jan 11 10:36:17 2024
@author: xm AZHE
"""
import PyPDF2
file=r'C:\Users\xm\Downloads\xxx1.pdf'
# 打開PDF文件
pdf_file = open(file, 'rb')
# 創(chuàng)建一個PDF閱讀器對象
pdf_reader = PyPDF2.PdfReader(pdf_file)
# 創(chuàng)建一個新的PDF寫入器對象
pdf_writer = PyPDF2.PdfWriter()
# 截取第0,第101到108頁
page = pdf_reader.pages[0]
pdf_writer.add_page(page)
for i in range(101,109):
    page = pdf_reader.pages[i]
    pdf_writer.add_page(page)
    # 順便導(dǎo)出下每頁的圖片
    count = 0
    for image_file_object in page.images:
        with open(str(count) + image_file_object.name, "wb") as fp:
            fp.write(image_file_object.data)
            count += 1
    # 打印下下每頁的文字
    page.extract_text(0)
# 處理的文件加個密
pdf_writer.encrypt("123456")
# 創(chuàng)建一個新的PDF文件并將頁面寫入其中
out_file=file.replace('.pdf','_remake.pdf')
output_file = open(out_file, 'wb')
pdf_writer.write(output_file)
# 關(guān)閉文件
output_file.close()
pdf_file.close()

PS: 解密用

if reader.is_encrypted:
    reader.decrypt("123456")

到此這篇關(guān)于python 處理pdf加密文件的文章就介紹到這了,更多相關(guān)python pdf加密文件內(nèi)容請搜索腳本之家以前的文章或繼續(xù)瀏覽下面的相關(guān)文章希望大家以后多多支持腳本之家!

相關(guān)文章

最新評論