Python一鍵實(shí)現(xiàn)PDF文檔批量轉(zhuǎn)Word
無論是在工作還是學(xué)習(xí)當(dāng)中,大家都會(huì)遇到這樣一個(gè)問題,將“PDF當(dāng)中的內(nèi)容(文本和圖片)轉(zhuǎn)換為Word的格式”,也就是說從只讀轉(zhuǎn)換成可編輯的格式。網(wǎng)上絕大多數(shù)的工具也都是收費(fèi)的,今天小編就給大家制作了一款批量將PDF
文件轉(zhuǎn)換為Word
的神器,使用起來也是相當(dāng)?shù)姆奖恪?/p>
實(shí)現(xiàn)效果
我們首先來看一下出來的效果,如下圖所示
環(huán)境準(zhǔn)備
用到的模塊叫做pdf2docx
,我們通過pip
命令進(jìn)行下載,如下
pip?install?pdf2docx
后續(xù)我們還可以為py
文件打包,用到的庫是pyinstaller
pip?install?pyinstaller
代碼實(shí)現(xiàn)
我們先簡(jiǎn)單地實(shí)現(xiàn)將單個(gè)PDF
文檔轉(zhuǎn)換成Word
文檔,代碼如下
from pdf2docx import Converter cv = Converter(r"pdf文件的路徑") cv.convert("test.docx", start=0,end=None) cv.close()
那么上面的是單個(gè)PDF
文件,要是涉及到是多個(gè)PDF
文件,則需要用到遍歷上傳過來的每一個(gè)文件,用到for
循環(huán)遍歷
def startAction(self): output_path_1 = Path.joinpath(Path.home(), "Desktop") output_path_2 = str(output_path_1) + "\\output" if not os.path.exists(output_path_2): os.mkdir(output_path_2) for path_list in pdfPath_list: print("路徑: ", path_list) name = path_list.split("/")[-1].split(".")[0] cv = Converter(path_list) cv.convert(output_path_2 + "\\{}.docx".format(name), start=0, end=None) cv.close() msg_box = QMessageBox(QMessageBox.Information, '完成', '提取完成', QMessageBox.Yes) msg_box.exec_()
上述的代碼,我們首先將指定好輸出的Word
文檔的位置,這里小編設(shè)置的是在桌面,然后通過for循環(huán)去遍歷處理每一個(gè)PDF
文檔,當(dāng)所有的步驟都完成的時(shí)候,提示我們已經(jīng)完成了。
當(dāng)然整個(gè)可視化界面當(dāng)中還有一個(gè)上傳文件的功能,代碼如下
# 選擇本地文件上傳 def uploadFiles(self): global pdfPath_list # 這里為了方便別的地方引用文件路徑,將其設(shè)置為全局變量 pdfPath_list, fileType = QFileDialog.getOpenFileNames(self.ui, "上傳文件", r"路徑", "*.pdf;;All Files(*)") # 顯示所選文件的路徑 self.ui.lineEdit.setText(",".join(pdfPath_list))
整體的代碼如下所示
from PySide2.QtWidgets import QApplication, QMessageBox, QFileDialog from PySide2.QtUiTools import QUiLoader from pdf2docx import Converter from pathlib import Path import os class OCRQt: def __init__(self): self.ui = QUiLoader().load('pdf2word.ui') self.ui.pushButton.clicked.connect(self.uploadFiles) self.ui.pushButton_2.clicked.connect(self.startAction) def uploadFiles(self): ........ ........ def startAction(self): ....... ....... if __name__ == '__main__': app = QApplication([]) # 顯示創(chuàng)建的界面 MainWindow = OCRQt() # 創(chuàng)建窗體對(duì)象 MainWindow.ui.show() # 顯示窗體 app.exit(app.exec_()) # 程序關(guān)閉時(shí)退出進(jìn)程
到此這篇關(guān)于Python一鍵實(shí)現(xiàn)PDF文檔批量轉(zhuǎn)Word的文章就介紹到這了,更多相關(guān)Python PDF轉(zhuǎn)Word內(nèi)容請(qǐng)搜索腳本之家以前的文章或繼續(xù)瀏覽下面的相關(guān)文章希望大家以后多多支持腳本之家!
相關(guān)文章
python中dict字典的查詢鍵值對(duì) 遍歷 排序 創(chuàng)建 訪問 更新 刪除基礎(chǔ)操作方法
字典的每個(gè)鍵值(key=>value)對(duì)用冒號(hào)(:)分割,每個(gè)對(duì)之間用逗號(hào)(,)分割,整個(gè)字典包括在花括號(hào)({})中,本文講述了python中dict字典的查詢鍵值對(duì) 遍歷 排序 創(chuàng)建 訪問 更新 刪除基礎(chǔ)操作方法2018-09-09Python查找不限層級(jí)Json數(shù)據(jù)中某個(gè)key或者value的路徑方式
今天小編就為大家分享一篇Python查找不限層級(jí)Json數(shù)據(jù)中某個(gè)key或者value的路徑方式,具有很好的參考價(jià)值,希望對(duì)大家有所幫助。一起跟隨小編過來看看吧2020-02-02Python中的異常處理相關(guān)語句基礎(chǔ)學(xué)習(xí)筆記
這里我們簡(jiǎn)單整理一下Python中的異常處理相關(guān)語句基礎(chǔ)學(xué)習(xí)筆記,包括try...except與assert等基本語句的用法講解:2016-07-07wxpython中利用線程防止假死的實(shí)現(xiàn)方法
上午抽空學(xué)習(xí)了一下在wxpython中啟用線程的方法,將GUI和功能的執(zhí)行分開,果然程序運(yùn)行起來杠杠滴。因?yàn)槲夷莻€(gè)軟件的代碼暫時(shí)不能公開,這里專門寫個(gè)小程序,作為今天的筆記吧2014-08-08