一文教會你用Python實現(xiàn)pdf轉(zhuǎn)word
一、實驗?zāi)繕?/h2>
通過利用python中的pyinstaller庫和PySimpleGUI庫,實現(xiàn)將pdf轉(zhuǎn)為word的實際功能。
二、實驗準備
1、安裝pdf2docx庫
pip install pdf2docx
2、安裝PySimpleGUI庫
pip install PySimpleGUI
三、實驗代碼
from pdf2docx import Converter
import PySimpleGUI as sg
def pdf2word(file_path):
file_name = file_path.split('.')[0]
doc_file = f'{file_name}.docx'
p2w = Converter(file_path)
p2w.convert(doc_file, start=0, end=None)
p2w.close()
return doc_file
def main():
# 選擇主題
sg.theme('DarkAmber')
layout = [
[sg.Text('pdfToword', font=('微軟雅黑', 12)),
sg.Text('', key='filename', size=(50, 1), font=('微軟雅黑', 10))],
[sg.Output(size=(80, 10), font=('微軟雅黑', 10))],
[sg.FilesBrowse('選擇文件', key='file', target='filename'), sg.Button('開始轉(zhuǎn)換'), sg.Button('退出')]]
# 創(chuàng)建窗口
window = sg.Window("張臥虎", layout, font=("微軟雅黑", 15), default_element_size=(50, 1))
# 事件循環(huán)
while True:
# 窗口的讀取,有兩個返回值(1.事件;2.值)
event, values = window.read()
print(event, values)
if event == "開始轉(zhuǎn)換":
if values['file'] and values['file'].split('.')[1] == 'pdf':
filename = pdf2word(values['file'])
print('文件個數(shù) :1')
print('\n' + '轉(zhuǎn)換成功!' + '\n')
print('文件保存位置:', filename)
elif values['file'] and values['file'].split(';')[0].split('.')[1] == 'pdf':
print('文件個數(shù) :{}'.format(len(values['file'].split(';'))))
for f in values['file'].split(';'):
filename = pdf2word(f)
print('\n' + '轉(zhuǎn)換成功!' + '\n')
print('文件保存位置:', filename)
else:
print('請選擇pdf格式的文件哦!')
if event in (None, '退出'):
break
window.close()
main()四、部分代碼解析
1、pdf轉(zhuǎn)word代碼主體部分
def pdf2word(file_path):
file_name = file_path.split('.')[0]
doc_file = f'{file_name}.docx'
p2w = Converter(file_path)
p2w.convert(doc_file, start=0, end=None)
p2w.close()
return doc_fileconvert(doc_file,start,end)函數(shù)中
doc_file:轉(zhuǎn)化完成后文件名
start:轉(zhuǎn)化開始頁面
end:轉(zhuǎn)化結(jié)束頁面
注意點:
①若不給start,end參數(shù)則默認轉(zhuǎn)化全篇
②對于不連續(xù)的頁面,也可寫作convert(doc_file , pages = [2,4,6])
2、圖形化界面部分
sg.theme('default1')
layout = [[sg.Text('pdfToword', font=('微軟雅黑', 12)),
sg.Text('', key='filename', size=(50, 1), font=('微軟雅黑', 10))],
[sg.Output(size=(80, 10), font=('微軟雅黑', 10))],
[sg.FilesBrowse('選擇文件', key='file', target='filename'), sg.Button('開始轉(zhuǎn)換'),sg.Button('退出')]]
window = sg.Window("id", layout, font=("微軟雅黑", 15), default_element_size=(50, 1))theme表示主題,即圖形化界面的主題顏色(sg.theme_list()可以查看所有可用主題)
3、實現(xiàn)多個文件轉(zhuǎn)化
if event == "開始轉(zhuǎn)換":
if values['file'] and values['file'].split('.')[1] == 'pdf':
filename = pdf2word(values['file'])
print('文件個數(shù) :1')
print('\n' + '轉(zhuǎn)換成功!' + '\n')
print('文件保存位置:', filename)
elif values['file'] and values['file'].split(';')[0].split('.')[1] == 'pdf':
print('文件個數(shù) :{}'.format(len(values['file'].split(';'))))
for f in values['file'].split(';'):
filename = pdf2word(f)
print('\n' + '轉(zhuǎn)換成功!' + '\n')
print('文件保存位置:', filename)
else:
print('請選擇pdf格式的文件')①第一個if處,通過“.”進行劃分,判斷是否為單個且pdf格式文件
②else if處,通過“;”劃分,將所有文件的存儲路徑儲存在一個數(shù)組中,利用循環(huán)來遍歷數(shù)組,從而達到依次轉(zhuǎn)化的目的
③else處,若傳入非pdf文件則輸出提示文字
五、結(jié)果

完結(jié)撒花!
總結(jié)
到此這篇關(guān)于用Python實現(xiàn)pdf轉(zhuǎn)word的文章就介紹到這了,更多相關(guān)Python實現(xiàn)pdf轉(zhuǎn)word內(nèi)容請搜索腳本之家以前的文章或繼續(xù)瀏覽下面的相關(guān)文章希望大家以后多多支持腳本之家!
相關(guān)文章
Python基于opencv的簡單圖像輪廓形狀識別(全網(wǎng)最簡單最少代碼)
這篇文章主要介紹了基于opencv的簡單圖像輪廓形狀識別(全網(wǎng)最簡單最少代碼),文中通過示例代碼介紹的非常詳細,對大家的學(xué)習(xí)或者工作具有一定的參考學(xué)習(xí)價值,需要的朋友們下面隨著小編來一起學(xué)習(xí)學(xué)習(xí)吧2021-01-01
各種Python庫安裝包下載地址與安裝過程詳細介紹(Windows版)
這篇文章主要介紹了Windows版的各種Python庫安裝包下載地址與安裝過程詳細介紹,本文給大家提供了windows版的各種Python庫安裝包下載地址等相關(guān)知識,非常不錯具有參考借鑒價值,需要的朋友可以參考下2016-11-11
Python函數(shù)式編程指南(二):從函數(shù)開始
這篇文章主要介紹了Python函數(shù)式編程指南(二):從函數(shù)開始,本文講解了定義一個函數(shù)、使用函數(shù)賦值、閉包、作為參數(shù)等內(nèi)容,需要的朋友可以參考下2015-06-06
Python在Scrapy中設(shè)置采集深度的實現(xiàn)
Scrapy是一個功能強大的Python爬蟲框架,通過設(shè)置采集深度,可以優(yōu)化爬蟲效率,并防止爬蟲陷入無盡的鏈接循環(huán),本文詳細介紹了如何在Scrapy中控制采集深度,感興趣的可以了解一下2024-10-10

