利用Python的PyPDF2庫(kù)提取pdf中的圖片
一、PyPDF2庫(kù)是什么?
PyPDF2庫(kù)是一個(gè)用于處理PDF文件的Python庫(kù)。它提供了一系列的工具來(lái)讀取、編輯、合并、拆分和加密PDF文件,使得我們可以在Python環(huán)境下輕松地對(duì)PDF文件進(jìn)行操作。
使用PyPDF2庫(kù),我們可以輕松地讀取PDF文件中的文本和元數(shù)據(jù)信息,如標(biāo)題、作者、主題和關(guān)鍵字等。同時(shí),我們可以將多個(gè)PDF文件合并成一個(gè)文件,或者將一個(gè)PDF文件拆分成多個(gè)文件。此外,還可以對(duì)PDF文件進(jìn)行加密,以保護(hù)其內(nèi)容不被未授權(quán)的訪問(wèn)者所查看。
除此之外,PyPDF2庫(kù)還支持對(duì)PDF文件進(jìn)行旋轉(zhuǎn)和裁剪操作,使得我們可以調(diào)整PDF文件中的頁(yè)面排版和大小。同時(shí),它還提供了一些高級(jí)功能,如添加水印、添加書(shū)簽、添加注釋等,使得我們可以為PDF文件添加更多的信息和內(nèi)容。
總的來(lái)說(shuō),PyPDF2庫(kù)提供了一系列功能強(qiáng)大的工具,可以幫助我們輕松地處理PDF文件。它可以應(yīng)用于很多場(chǎng)景,如文檔管理、電子出版、數(shù)據(jù)分析等領(lǐng)域,是Python開(kāi)發(fā)者們不可或缺的工具。
二、安裝PyPDF2庫(kù)
pip install PyPDF2
三、查看PyPDF2庫(kù)版本
pip show PyPDF2
Name: PyPDF2
Version: 3.0.1
Summary: A pure-python PDF library capable of splitting, merging, cropping, and transforming PDF files
Home-page:
Author:
Author-email: Mathieu Fenniak biziqe@mathieu.fenniak.net
License:
Requires: typing_extensions
Required-by:
四、使用方法
待提取的pdf截圖
1.引入庫(kù)
import PyPDF2
2.定義pdf路徑
local = '/Users/kkstar/Downloads/'
3.打開(kāi)PDF文件
pdf_file = open(local+'demo_pic.pdf', 'rb')
4.創(chuàng)建PDF閱讀器對(duì)象
pdf_reader = PyPDF2.PdfReader(pdf_file)
5.獲取PDF文件中的頁(yè)數(shù)
num_pages = len(pdf_reader.pages)
6.遍歷每一頁(yè)進(jìn)行處理
# 遍歷每一頁(yè) for page_num in range(num_pages): # 獲取當(dāng)前頁(yè)對(duì)象 page_obj = pdf_reader.pages[page_num] # 獲取當(dāng)前頁(yè)中的所有對(duì)象 page_objs = page_obj['/Resources']['/XObject'].get_object() # 遍歷每個(gè)對(duì)象 for obj_name in page_objs: # 判斷對(duì)象是否為圖片 if page_objs[obj_name]['/Subtype'] == '/Image': # 獲取圖片對(duì)象 img_obj = page_objs[obj_name] # 獲取圖片數(shù)據(jù) img_data = img_obj.get_data() # 將圖片數(shù)據(jù)保存為文件 with open(local+obj_name + '.jpg', 'wb') as img_file: img_file.write(img_data)
7.提取出來(lái)的圖片
以上就是利用Python的PyPDF2庫(kù)提取pdf中的圖片的詳細(xì)內(nèi)容,更多關(guān)于Python PyPDF2提取pdf圖片的資料請(qǐng)關(guān)注腳本之家其它相關(guān)文章!
相關(guān)文章
OpenCV半小時(shí)掌握基本操作之圖像基礎(chǔ)操作
這篇文章主要介紹了OpenCV基本操作之圖像基礎(chǔ)操作,本文給大家介紹的非常詳細(xì),對(duì)大家的學(xué)習(xí)或工作具有一定的參考借鑒價(jià)值,需要的朋友可以參考下2021-09-09Python實(shí)現(xiàn)為圖片添加水印的示例詳解
這篇文章主要介紹了如何通過(guò)Python3實(shí)現(xiàn)添加水印,這樣發(fā)朋友圈,圖片再也不怕被盜了?。?!文中的示例代碼簡(jiǎn)潔易懂,需要的可以參考一下2022-02-02PyQt教程之自定義組件Switch?Button的實(shí)現(xiàn)
這篇文章主要為大家詳細(xì)介紹了PyQt中如何實(shí)現(xiàn)自定義組件Switch?Button,文中的示例代碼簡(jiǎn)潔易懂,具有一定的學(xué)習(xí)價(jià)值,感興趣的可以了解一下2023-05-05用Python爬取各大高校并可視化幫弟弟選大學(xué),弟弟直呼牛X
高考結(jié)束了,接下來(lái)最重要的就是玩玩玩,然后準(zhǔn)備報(bào)志愿吧.中國(guó)教育在線(xiàn)網(wǎng)顯示國(guó)內(nèi)目前共有2857所高等院校,報(bào)一個(gè)理想的學(xué)校簡(jiǎn)直是千里挑一.正好表弟求著我讓我?guī)退x學(xué)校,我想著十年寒窗苦讀也不容易不如就用python幫幫他.分析一下目前國(guó)內(nèi)的大學(xué),需要的朋友可以參考下2021-06-06