python的?PyPDF2實現(xiàn)pdf文件切割和合并
今天想使用pdf的切分軟件實現(xiàn)pdf文件的切分,但是軟件需要會員???好吧,,,,又要會員,這么簡單的功能能難倒咱們程序員嗎。俗話說自給自足豐衣足食,決定使用python自己切分文件。
在百度了一番后,發(fā)現(xiàn)大多都是使用 Adobe Acrobat 軟件進(jìn)行剪裁,這完全不 Pythonic,因此又找了用 Python 處理 PDF 文件的方法,最后發(fā)現(xiàn)了 PyPDF2 這個庫,本文將利用這個庫,實現(xiàn)對 PDF 的分割。
首先,你需要通過 pip 安裝這個庫:
pip install PyPDF2
要使用python的
# 導(dǎo)入讀寫pdf模塊 from PyPDF2 import PdfFileReader, PdfFileWriter ''' 注意: 頁數(shù)從0開始索引 range()是左閉右開區(qū)間 ''' def split_pdf(file_name, start_page, end_page, output_pdf): ''' :param file_name:待分割的pdf文件名 :param start_page: 執(zhí)行分割的開始頁數(shù) :param end_page: 執(zhí)行分割的結(jié)束位頁數(shù) :param output_pdf: 保存切割后的文件名 ''' # 讀取待分割的pdf文件 input_file = PdfFileReader(open(file_name, 'rb')) # 實例一個 PDF文件編寫器 output_file = PdfFileWriter() # 把分割的文件添加在一起 for i in range(start_page, end_page): output_file.addPage(input_file.getPage(i)) # 將分割的文件輸出保存 with open(output_pdf, 'wb') as f: output_file.write(f) def merge_pdf(merge_list, output_pdf): """ merge_list: 需要合并的pdf列表 output_pdf:合并之后的pdf名 """ # 實例一個 PDF文件編寫器 output = PdfFileWriter() for ml in merge_list: pdf_input = PdfFileReader(open(ml, 'rb')) page_count = pdf_input.getNumPages() for i in range(page_count): output.addPage(pdf_input.getPage(i)) output.write(open(output_pdf, 'wb')) if __name__ == '__main__': # 分割pdf split_pdf("test.pdf", 0, 3, "0-2.pdf") split_pdf("test.pdf", 7, 12, "7-11.pdf") split_pdf("test.pdf", 18, 23, "18-22.pdf") split_pdf("test.pdf", 27, 33, "26-32.pdf") split_pdf("test.pdf", 40, 44, "40-43.pdf") split_pdf("test.pdf", 46, 51, "46-50.pdf") split_pdf("test.pdf", 58, 66, "58-65.pdf") split_pdf("test.pdf", 77, 84, "77-83.pdf") split_pdf("test.pdf", 93, 97, "93-96.pdf") split_pdf("test.pdf", 102, 106, "102-105.pdf") # 合并pdf # 合并的pdf列表 pdf_list = ["0-2.pdf", "7-11.pdf", "18-22.pdf", "26-32.pdf", "40-43.pdf", "46-50.pdf", "58-65.pdf", "77-83.pdf", "93-96.pdf", "102-105.pdf"] merge_pdf(pdf_list, "all.pdf")
下面是切分好的文件效果,完美
到此這篇關(guān)于python的?PyPDF2實現(xiàn)pdf文件切割和合并的文章就介紹到這了,更多相關(guān)python PyPDF2實現(xiàn)pdf剪裁內(nèi)容請搜索腳本之家以前的文章或繼續(xù)瀏覽下面的相關(guān)文章希望大家以后多多支持腳本之家!
相關(guān)文章
Django的restframework接口框架自定義返回數(shù)據(jù)格式的示例詳解
這篇文章主要介紹了Django的restframework接口框架自定義返回數(shù)據(jù)格式,本文介紹了通過Django的restframework接口框架自定義Response返回對象來自定義返回數(shù)據(jù)格式,本文通過示例代碼給大家介紹的非常詳細(xì),需要的朋友可以參考下2022-07-07python神經(jīng)網(wǎng)絡(luò)Xception模型復(fù)現(xiàn)詳解
這篇文章主要為大家介紹了python神經(jīng)網(wǎng)絡(luò)Xception模型復(fù)現(xiàn)詳解,有需要的朋友可以借鑒參考下,希望能夠有所幫助,祝大家多多進(jìn)步,早日升職加薪2022-05-05Python中__repr__和__str__區(qū)別詳解
這篇文章主要介紹了Python中__repr__和__str__區(qū)別詳解,文中通過示例代碼介紹的非常詳細(xì),對大家的學(xué)習(xí)或者工作具有一定的參考學(xué)習(xí)價值,需要的朋友們下面隨著小編來一起學(xué)習(xí)學(xué)習(xí)吧2019-11-11Tensorflow加載Vgg預(yù)訓(xùn)練模型操作
這篇文章主要介紹了Tensorflow加載Vgg預(yù)訓(xùn)練模型操作,具有很好的參考價值,希望對大家有所幫助。一起跟隨小編過來看看吧2020-05-05Python(TensorFlow框架)實現(xiàn)手寫數(shù)字識別系統(tǒng)的方法
這篇文章主要介紹了Python(TensorFlow框架)實現(xiàn)手寫數(shù)字識別系統(tǒng)的方法。小編覺得挺不錯的,現(xiàn)在分享給大家,也給大家做個參考。一起跟隨小編過來看看吧2018-05-05