如何使用python進行pdf文件分割
更新時間:2019年11月11日 14:36:34 作者:Ye_yang
這篇文章主要介紹了如何使用python進行pdf文件分割,文中通過示例代碼介紹的非常詳細,對大家的學習或者工作具有一定的參考學習價值,需要的朋友可以參考下
這篇文章主要介紹了如何使用python進行pdf文件分割,文中通過示例代碼介紹的非常詳細,對大家的學習或者工作具有一定的參考學習價值,需要的朋友可以參考下
代碼如下
import os
from pyPdf import PdfFileWriter, PdfFileReader
def split(pdf_file, delta, output_dir):
if not os.path.exists(output_dir):
os.makedirs(output_dir)
if not os.path.exists(pdf_file):
return
print('----------參數(shù)信息---------------')
print('File:' + pdf_file)
print('PageNums:' + str(delta))
print('Dest:' + output_dir)
print('-----------pdf開始切分-----------')
file_name = pdf_file.split('/')[-1].split('.')[0]
output_dir = os.path.join(out_dir, file_name)
if not os.path.exists(output_dir):
os.mkdir(output_dir)
input_stream = file(pdf_file, 'rb')
pdf_input = PdfFileReader(input_stream)
page_count = pdf_input.getNumPages()
sum_page_count = int(page_count / (delta * 1.0))
remind_page = page_count % delta
for i in range(0, sum_page_count + 1):
start = i * delta
end = (i + 1) * delta
pdf_out = PdfFileWriter()
file_path = os.path.join(output_dir, os.path.split(pdf_file)[1]) #
if i < sum_page_count:
full_file_name = file_name + str(start + 1) + '-' + str(end) + ".pdf"
file_path = os.path.join(output_dir, full_file_name)
print(full_file_name + '切分完成')
for j in range(start, end):
page = pdf_input.getPage(j)
pdf_out.addPage(page)
else:
full_file_name = file_name + str(start + 1) + '-' + str(start + remind_page) + ".pdf"
file_path = os.path.join(output_dir, full_file_name)
print(full_file_name + '切分完成')
for j in range(delta * (sum_page_count), page_count):
page = pdf_input.getPage(j)
pdf_out.addPage(page)
out_stream = file(file_path, 'wb')
pdf_out.write(out_stream)
out_stream.close()
input_stream.close()
print('-----------pdf切分完成-----------')
if __name__ == '__main__':
import sys
#python splitPdf.py /Users/xxxxx/Downloads/UNIX網(wǎng)絡編程卷1:套接字聯(lián)網(wǎng)API(第3版).pdf 180 /Users/xxxxx/Documents/output
try:
pdf_path = sys.argv[1]
page_count = int(sys.argv[2])
out_dir = sys.argv[3]
split(pdf_path, page_count, out_dir)
except:
pass
使用方法
$ python splitPdf.py /Users/xxxxx/Downloads/UNIX網(wǎng)絡編程卷1:套接字聯(lián)網(wǎng)API(第3版).pdf 180 /Users/xxxxx/Documents/output ----------參數(shù)信息--------------- File:/Users/xxxxx/Downloads/UNIX網(wǎng)絡編程卷1:套接字聯(lián)網(wǎng)API(第3版).pdf PageNums:180 Dest:/Users/xxxxx/Documents/output -----------pdf開始切分----------- UNIX網(wǎng)絡編程卷1:套接字聯(lián)網(wǎng)API(第3版)1-180.pdf切分完成 UNIX網(wǎng)絡編程卷1:套接字聯(lián)網(wǎng)API(第3版)181-360.pdf切分完成 UNIX網(wǎng)絡編程卷1:套接字聯(lián)網(wǎng)API(第3版)361-540.pdf切分完成 UNIX網(wǎng)絡編程卷1:套接字聯(lián)網(wǎng)API(第3版)541-720.pdf切分完成 UNIX網(wǎng)絡編程卷1:套接字聯(lián)網(wǎng)API(第3版)721-823.pdf切分完成 -----------pdf切分完成-----------
以上就是本文的全部內(nèi)容,希望對大家的學習有所幫助,也希望大家多多支持腳本之家。
您可能感興趣的文章:
- Python常見讀寫文件操作實例總結(jié)【文本、json、csv、pdf等】
- Python如何把多個PDF文件合并代碼實例
- Python 實現(xiàn)加密過的PDF文件轉(zhuǎn)WORD格式
- Python3將jpg轉(zhuǎn)為pdf文件的方法示例
- Python解析并讀取PDF文件內(nèi)容的方法
- Python生成pdf文件的方法
- 基于Python實現(xiàn)對PDF文件的OCR識別
- python實現(xiàn)pdf轉(zhuǎn)換成word/txt純文本文件
- Python2.7讀取PDF文件的方法示例
- Python實現(xiàn)簡單拆分PDF文件的方法
- python3如何將docx轉(zhuǎn)換成pdf文件
- Python編程快速上手——PDF文件操作案例分析
相關文章
python簡單實現(xiàn)基于SSL的IRC bot實例
這篇文章主要介紹了python簡單實現(xiàn)基于SSL的IRC bot,實例分析了IRC機器人的相關實現(xiàn)技巧,需要的朋友可以參考下2015-06-06
解決win7操作系統(tǒng)Python3.7.1安裝后啟動提示缺少.dll文件問題
這篇文章主要介紹了解決win7操作系統(tǒng)Python3.7.1安裝后啟動提示缺少.dll文件問題,本文給大家提供兩種解決方法,非常不錯,具有一定的參考借鑒價值,需要的朋友可以參考下2019-07-07
python函數(shù)中將變量名轉(zhuǎn)換成字符串實例
這篇文章主要介紹了python函數(shù)中將變量名轉(zhuǎn)換成字符串實例,具有很好的參考價值,希望對大家有所幫助。一起跟隨小編過來看看吧2020-05-05
Python實現(xiàn)判斷并移除列表指定位置元素的方法
這篇文章主要介紹了Python實現(xiàn)判斷并移除列表指定位置元素的方法,涉及Python針對列表的索引范圍判斷及元素刪除等相關操作技巧,需要的朋友可以參考下2018-04-04

