使用Python將PDF轉(zhuǎn)換為文檔的方法實現(xiàn)
所需模塊
在深入研究代碼之前,請確保你已在 Python 環(huán)境中安裝了這些必需的模塊。
pip install pdf2docx
使用 Python 將 PDF 轉(zhuǎn)換為文檔
pdf2docx 模塊使用 PyMuPDF 從 PDF 中提取信息,包括文本、圖片和插圖。它可以通過調(diào)整邊距、部分和列來生成新的布局。它提供文本方向、方向和字體屬性等功能。Microsoft Word、PDF、RTF、ODT 和 TXT 等文檔文件對于學(xué)術(shù)界、商業(yè)、研究和出版等各個領(lǐng)域至關(guān)重要。PDF 文件靈活、跨平臺兼容,并且可以在多種操作系統(tǒng)上查看。
使用“pdf2docx”庫將 PDF 轉(zhuǎn)換為文檔
該代碼片段使用“pdf2docx”庫將 PDF 文件轉(zhuǎn)換為 DOCX 文件,并使用“Converter”函數(shù)初始化轉(zhuǎn)換過程。在“cv”對象上調(diào)用“convert()”方法,并調(diào)用“close()”方法來終止轉(zhuǎn)換。
# 導(dǎo)入所需模塊 from pdf2docx import Converter # 將PDF的位置保存在一個單獨的變量中 pdf_file = r"C:\Users\DELL\Desktop\INTERNSHIP\DSA GEEEKSFORGEEKS.pdf" # 在單獨的變量中維護(hù)文檔的路徑 docx_file = r"C:\Users\DELL\Desktop\INTERNSHIP\DSA GEEEKSFORGEEKS.docx" # 使用內(nèi)置函數(shù),通過將PDF文件保存在變量中,將其轉(zhuǎn)換為文檔文件。 cv = Converter(pdf_file) # 將文檔存儲在變量的初始化路徑中 cv.convert(docx_file) # 通過函數(shù)close()轉(zhuǎn)換閉包 cv.close()
輸出:
使用文件路徑導(dǎo)入 Parse
該代碼使用pdf2docx庫中的extract函數(shù)將PDF文件轉(zhuǎn)換為DOCX文件,將其轉(zhuǎn)換為所需的格式并將其存儲在指定位置。
from pdf2docx import parse pdf_file = r"C:\Users\DELL\Desktop\INTERNSHIP\DSA GEEEKSFORGEEKS.pdf" docx_file = r"C:\Users\DELL\Desktop\INTERNSHIP\DSA GEEEKSFORGEEKS.docx" # 將pdf轉(zhuǎn)換為docx parse(pdf_file, docx_file)
輸出:
到此這篇關(guān)于使用Python將PDF轉(zhuǎn)換為文檔的方法實現(xiàn)的文章就介紹到這了,更多相關(guān)Python將PDF轉(zhuǎn)換為文檔內(nèi)容請搜索腳本之家以前的文章或繼續(xù)瀏覽下面的相關(guān)文章希望大家以后多多支持腳本之家!
相關(guān)文章
Python安裝第三方庫的方法(pip/conda、easy_install、setup.py)
這篇文章主要介紹了Python安裝第三方庫(pip/conda、easy_install、setup.py)的相關(guān)知識,本文通過實例代碼給大家介紹的非常詳細(xì),對大家的學(xué)習(xí)或工作具有一定的參考借鑒價值,需要的朋友可以參考下2023-05-05解決python gdal投影坐標(biāo)系轉(zhuǎn)換的問題
今天小編就為大家分享一篇解決python gdal投影坐標(biāo)系轉(zhuǎn)換的問題,具有很好的參考價值,希望對大家有所幫助。一起跟隨小編過來看看吧2020-01-01Python實現(xiàn)批量獲取文件夾內(nèi)文件名并重命名
這篇文章主要為大家詳細(xì)介紹了Python如何批量獲取文件夾內(nèi)文件名及重命名文件,文中的示例代碼講解詳細(xì),感興趣的小伙伴可以跟隨小編一起學(xué)習(xí)一下2025-02-02