欧美bbbwbbbw肥妇,免费乱码人妻系列日韩,一级黄片

Python一鍵實(shí)現(xiàn)PDF文檔批量轉(zhuǎn)Word

 更新時(shí)間:2022年08月29日 11:30:10   作者:欣一  
無論是在工作還是學(xué)習(xí)當(dāng)中,大家都會(huì)遇到這樣一個(gè)問題,將“PDF當(dāng)中的內(nèi)容(文本和圖片)轉(zhuǎn)換為Word的格式”,本文將用Python實(shí)現(xiàn)一鍵批量將PDF轉(zhuǎn)Word,需要的可以參考一下

無論是在工作還是學(xué)習(xí)當(dāng)中,大家都會(huì)遇到這樣一個(gè)問題,將“PDF當(dāng)中的內(nèi)容(文本和圖片)轉(zhuǎn)換為Word的格式”,也就是說從只讀轉(zhuǎn)換成可編輯的格式。網(wǎng)上絕大多數(shù)的工具也都是收費(fèi)的,今天小編就給大家制作了一款批量將PDF文件轉(zhuǎn)換為Word的神器,使用起來也是相當(dāng)?shù)姆奖恪?/p>

實(shí)現(xiàn)效果

我們首先來看一下出來的效果,如下圖所示

環(huán)境準(zhǔn)備

用到的模塊叫做pdf2docx,我們通過pip命令進(jìn)行下載,如下

pip?install?pdf2docx

后續(xù)我們還可以為py文件打包,用到的庫是pyinstaller

pip?install?pyinstaller

代碼實(shí)現(xiàn)

我們先簡(jiǎn)單地實(shí)現(xiàn)將單個(gè)PDF文檔轉(zhuǎn)換成Word文檔,代碼如下

from pdf2docx import Converter
cv = Converter(r"pdf文件的路徑")
cv.convert("test.docx", start=0,end=None)
cv.close()

那么上面的是單個(gè)PDF文件,要是涉及到是多個(gè)PDF文件,則需要用到遍歷上傳過來的每一個(gè)文件,用到for循環(huán)遍歷

def startAction(self):
    output_path_1 = Path.joinpath(Path.home(), "Desktop")
    output_path_2 = str(output_path_1) + "\\output"
    if not os.path.exists(output_path_2):
        os.mkdir(output_path_2)

    for path_list in pdfPath_list:
        print("路徑: ", path_list)
        name = path_list.split("/")[-1].split(".")[0]
        cv = Converter(path_list)
        cv.convert(output_path_2 + "\\{}.docx".format(name), start=0, end=None)
        cv.close()

    msg_box = QMessageBox(QMessageBox.Information, '完成', '提取完成', QMessageBox.Yes)
    msg_box.exec_()

上述的代碼,我們首先將指定好輸出的Word文檔的位置,這里小編設(shè)置的是在桌面,然后通過for循環(huán)去遍歷處理每一個(gè)PDF文檔,當(dāng)所有的步驟都完成的時(shí)候,提示我們已經(jīng)完成了。

當(dāng)然整個(gè)可視化界面當(dāng)中還有一個(gè)上傳文件的功能,代碼如下

# 選擇本地文件上傳
def uploadFiles(self):
    global pdfPath_list  # 這里為了方便別的地方引用文件路徑,將其設(shè)置為全局變量
    pdfPath_list, fileType = QFileDialog.getOpenFileNames(self.ui, "上傳文件", r"路徑", "*.pdf;;All Files(*)")
    # 顯示所選文件的路徑
    self.ui.lineEdit.setText(",".join(pdfPath_list))

整體的代碼如下所示

from PySide2.QtWidgets import QApplication, QMessageBox, QFileDialog
from PySide2.QtUiTools import QUiLoader
from pdf2docx import Converter
from pathlib import Path
import os

class OCRQt:
    def __init__(self):
        self.ui = QUiLoader().load('pdf2word.ui')
        self.ui.pushButton.clicked.connect(self.uploadFiles)
        self.ui.pushButton_2.clicked.connect(self.startAction)

    def uploadFiles(self):
        ........
        ........

    def startAction(self):
        .......
        .......

if __name__ == '__main__':
    app = QApplication([])
    # 顯示創(chuàng)建的界面
    MainWindow = OCRQt()  # 創(chuàng)建窗體對(duì)象
    MainWindow.ui.show()  # 顯示窗體
    app.exit(app.exec_())  # 程序關(guān)閉時(shí)退出進(jìn)程

到此這篇關(guān)于Python一鍵實(shí)現(xiàn)PDF文檔批量轉(zhuǎn)Word的文章就介紹到這了,更多相關(guān)Python PDF轉(zhuǎn)Word內(nèi)容請(qǐng)搜索腳本之家以前的文章或繼續(xù)瀏覽下面的相關(guān)文章希望大家以后多多支持腳本之家!

相關(guān)文章

最新評(píng)論