Python批量實(shí)現(xiàn)Word/EXCEL/PPT轉(zhuǎn)PDF
一、緒論背景
在日常辦公和文檔處理中,有時(shí)我們需要將多個(gè)Word文檔、Excel表格或PPT演示文稿轉(zhuǎn)換為PDF文件。將文檔轉(zhuǎn)換為PDF格式的好處是它可以保留文檔的布局和格式,并且可以在不同平臺(tái)上進(jìn)行方便的查看和共享。
本篇博文將介紹如何使用Python編程語(yǔ)言批量實(shí)現(xiàn)將多個(gè)Word、Excel和PPT文件轉(zhuǎn)換為PDF文件。我們將通過(guò)使用Python第三方庫(kù)來(lái)讀取、編輯和保存這些文檔,并使用合適的轉(zhuǎn)換工具將它們轉(zhuǎn)換為PDF格式。
具體實(shí)現(xiàn)方面,我們將首先安裝所需的Python庫(kù)和相關(guān)軟件,主要使用三個(gè)庫(kù)函數(shù):os, win32com.client, gc。
1)os : os 是Python內(nèi)置的一個(gè)與操作系統(tǒng)交互的庫(kù)。它提供了許多用于處理文件和目錄的函數(shù),例如創(chuàng)建、刪除、重命名文件或目錄,獲取文件屬性,遍歷目錄等。通過(guò)使用 os 庫(kù),我們可以在Python程序中執(zhí)行各種與操作系統(tǒng)相關(guān)的任務(wù)。
2)win32com.client : win32com.client 是一個(gè)用于與Windows平臺(tái)上的COM組件進(jìn)行交互的Python庫(kù)。COM(Component Object Model)是一種面向?qū)ο蟮慕M件技術(shù),允許不同的應(yīng)用程序之間進(jìn)行通信和交互。 win32com.client 庫(kù)提供了一種方便的方式來(lái)調(diào)用和操作COM組件,如Microsoft Office應(yīng)用程序(Word、Excel、PowerPoint等)。通過(guò)這個(gè)庫(kù),我們可以自動(dòng)化執(zhí)行一些Office任務(wù),如讀寫(xiě)文檔、操作Excel表格、創(chuàng)建PPT演示文稿等。
3)gc : gc 是Python內(nèi)置的垃圾回收模塊。垃圾回收是指在程序執(zhí)行過(guò)程中,自動(dòng)檢測(cè)和回收不再使用的內(nèi)存空間,以提高內(nèi)存利用率和程序性能。 gc 模塊為我們提供了一些功能,如手動(dòng)觸發(fā)垃圾回收、獲取和設(shè)置垃圾回收的閾值等。盡管Python有自動(dòng)的垃圾回收機(jī)制,但在某些情況下,我們可能需要手動(dòng)控制垃圾回收的行為。
然后,我們將編寫(xiě)Python代碼來(lái)遍歷指定文件夾中的所有文檔,并對(duì)每個(gè)文檔進(jìn)行逐個(gè)轉(zhuǎn)換。
最后,我們將保存轉(zhuǎn)換后的PDF文件到指定的目錄中。
通過(guò)閱讀本篇博文,你將學(xué)習(xí)到如何使用Python編程語(yǔ)言批量實(shí)現(xiàn)將多個(gè)Word、Excel和PPT文件轉(zhuǎn)換為PDF文件的方法。這將為你提供一種自動(dòng)化的方式來(lái)處理文檔轉(zhuǎn)換任務(wù),節(jié)省時(shí)間和精力,并提高工作效率。
無(wú)論你是一位辦公人員、學(xué)生還是有大量文檔需要處理的個(gè)人用戶(hù),本篇教程都將幫助你掌握如何使用Python批量實(shí)現(xiàn)Word、Excel和PPT轉(zhuǎn)換為PDF文件。讓我們一起開(kāi)始這個(gè)方便實(shí)用的文檔處理之旅吧!
二、代碼實(shí)踐
大家運(yùn)行本代碼,只需要更改為自己的路徑即可。如代碼中我的地址:D:\Pycharmproject2023\code_test_project\shan_test\data,改為你本地地址即可。
import os, win32com.client, gc
# Word
def word2Pdf(filePath, words):
# 如果沒(méi)有文件則提示后直接退出
if (len(words) < 1):
print("\n【無(wú) Word 文件】\n")
return
# 開(kāi)始轉(zhuǎn)換
print("\n【開(kāi)始 Word -> PDF 轉(zhuǎn)換】")
try:
print("打開(kāi) Word 進(jìn)程...")
word = win32com.client.Dispatch("Word.Application")
word.Visible = 0
word.DisplayAlerts = False
doc = None
for i in range(len(words)):
print(i)
fileName = words[i] # 文件名稱(chēng)
fromFile = os.path.join(filePath, fileName) # 文件地址
toFileName = changeSufix2Pdf(fileName) # 生成的文件名稱(chēng)
toFile = toFileJoin(filePath, toFileName) # 生成的文件地址
print("轉(zhuǎn)換:" + fileName + "文件中...")
# 某文件出錯(cuò)不影響其他文件打印
try:
doc = word.Documents.Open(fromFile)
doc.SaveAs(toFile, 17) # 生成的所有 PDF 都會(huì)在 PDF 文件夾中
print("轉(zhuǎn)換到:" + toFileName + "完成")
except Exception as e:
print(e)
# 關(guān)閉 Word 進(jìn)程
print("所有 Word 文件已打印完畢")
print("結(jié)束 Word 進(jìn)程...\n")
doc.Close()
doc = None
word.Quit()
word = None
except Exception as e:
print(e)
finally:
gc.collect()
# Excel
def excel2Pdf(filePath, excels):
# 如果沒(méi)有文件則提示后直接退出
if (len(excels) < 1):
print("\n【無(wú) Excel 文件】\n")
return
# 開(kāi)始轉(zhuǎn)換
print("\n【開(kāi)始 Excel -> PDF 轉(zhuǎn)換】")
try:
print("打開(kāi) Excel 進(jìn)程中...")
excel = win32com.client.Dispatch("Excel.Application")
excel.Visible = 0
excel.DisplayAlerts = False
wb = None
ws = None
for i in range(len(excels)):
print(i)
fileName = excels[i] # 文件名稱(chēng)
fromFile = os.path.join(filePath, fileName) # 文件地址
print("轉(zhuǎn)換:" + fileName + "文件中...")
# 某文件出錯(cuò)不影響其他文件打印
try:
wb = excel.Workbooks.Open(fromFile)
for j in range(wb.Worksheets.Count): # 工作表數(shù)量,一個(gè)工作簿可能有多張工作表
toFileName = addWorksheetsOrder(fileName, j + 1) # 生成的文件名稱(chēng)
toFile = toFileJoin(filePath, toFileName) # 生成的文件地址
ws = wb.Worksheets(j + 1) # 若為[0]則打包后會(huì)提示越界
ws.ExportAsFixedFormat(0, toFile) # 每一張都需要打印
print("轉(zhuǎn)換至:" + toFileName + "文件完成")
except Exception as e:
print(e)
# 關(guān)閉 Excel 進(jìn)程
print("所有 Excel 文件已打印完畢")
print("結(jié)束 Excel 進(jìn)程中...\n")
ws = None
wb.Close()
wb = None
excel.Quit()
excel = None
except Exception as e:
print(e)
finally:
gc.collect()
# PPT
def ppt2Pdf(filePath, ppts):
# 如果沒(méi)有文件則提示后直接退出
if (len(ppts) < 1):
print("\n【無(wú) PPT 文件】\n")
return
# 開(kāi)始轉(zhuǎn)換
print("\n【開(kāi)始 PPT -> PDF 轉(zhuǎn)換】")
try:
print("打開(kāi) PowerPoint 進(jìn)程中...")
powerpoint = win32com.client.Dispatch("PowerPoint.Application")
ppt = None
# 某文件出錯(cuò)不影響其他文件打印
for i in range(len(ppts)):
print(i)
fileName = ppts[i] # 文件名稱(chēng)
fromFile = os.path.join(filePath, fileName) # 文件地址
toFileName = changeSufix2Pdf(fileName) # 生成的文件名稱(chēng)
toFile = toFileJoin(filePath, toFileName) # 生成的文件地址
print("轉(zhuǎn)換:" + fileName + "文件中...")
try:
ppt = powerpoint.Presentations.Open(fromFile, WithWindow=False)
if ppt.Slides.Count > 0:
ppt.SaveAs(toFile, 32) # 如果為空則會(huì)跳出提示框(暫時(shí)沒(méi)有找到消除辦法)
print("轉(zhuǎn)換至:" + toFileName + "文件完成")
else:
print("(錯(cuò)誤,發(fā)生意外:此文件為空,跳過(guò)此文件)")
except Exception as e:
print(e)
# 關(guān)閉 PPT 進(jìn)程
print("所有 PPT 文件已打印完畢")
print("結(jié)束 PowerPoint 進(jìn)程中...\n")
ppt.Close()
ppt = None
powerpoint.Quit()
powerpoint = None
except Exception as e:
print(e)
finally:
gc.collect()
# 修改后綴名
def changeSufix2Pdf(file):
return file[:file.rfind('.')] + ".pdf"
# 添加工作簿序號(hào)
def addWorksheetsOrder(file, i):
return file[:file.rfind('.')] + "_工作表" + str(i) + ".pdf"
# 轉(zhuǎn)換地址
def toFileJoin(filePath, file):
return os.path.join(filePath, 'pdf', file[:file.rfind('.')] + ".pdf")
# 開(kāi)始程序
print("====================程序開(kāi)始====================")
print(
"【程序功能】將目標(biāo)路徑下內(nèi)所有的 ppt、excel、word 均生成一份對(duì)應(yīng)的 PDF 文件,存在新生成的 pdf 文件夾中(需已經(jīng)安裝office,不包括子文件夾)")
print(
"注意:若某 PPT 和 Excel 文件為空,則會(huì)出錯(cuò)跳過(guò)此文件。若轉(zhuǎn)換 PPT 時(shí)間過(guò)長(zhǎng),請(qǐng)查看是否有報(bào)錯(cuò)窗口等待確認(rèn),暫時(shí)無(wú)法徹底解決 PPT 的窗口問(wèn)題(為空錯(cuò)誤已解決)。在關(guān)閉進(jìn)程過(guò)程中,時(shí)間可能會(huì)較長(zhǎng),十秒左右,請(qǐng)耐心等待。")
# 需要轉(zhuǎn)換的文件路徑
# filePath = input("輸入目標(biāo)路徑:(若為當(dāng)前路徑:" + os.getcwd() + ",請(qǐng)直接回車(chē))\n")
filePath = "D:\Pycharmproject2023\code_test_project\shan_test\data"
# 目標(biāo)路徑,若沒(méi)有輸入路徑則為當(dāng)前路徑
if (filePath == ""):
filePath = os.getcwd()
# 將目標(biāo)文件夾所有文件歸類(lèi),轉(zhuǎn)換時(shí)只打開(kāi)一個(gè)進(jìn)程
words = []
ppts = []
excels = []
for fn in os.listdir(filePath):
if fn.endswith(('.doc', 'docx')):
words.append(fn)
if fn.endswith(('.ppt', 'pptx')):
ppts.append(fn)
if fn.endswith(('.xls', 'xlsx')):
excels.append(fn)
# 調(diào)用方法
print("====================開(kāi)始轉(zhuǎn)換====================")
# 保存路徑:新建 pdf 文件夾,所有生成的 PDF 文件都放在里面
folder = filePath + '\\pdf\\'
if not os.path.exists(folder):
os.makedirs(folder)
word2Pdf(filePath, words)
excel2Pdf(filePath, excels)
ppt2Pdf(filePath, ppts)
print("====================轉(zhuǎn)換結(jié)束====================")
print("\n====================程序結(jié)束====================")
# os.system("pause")三、實(shí)踐效果

以上就是Python批量實(shí)現(xiàn)Word/EXCEL/PPT轉(zhuǎn)PDF的詳細(xì)內(nèi)容,更多關(guān)于python word excel ppt轉(zhuǎn)pdf的資料請(qǐng)關(guān)注腳本之家其它相關(guān)文章!
- Python腳本自動(dòng)化實(shí)現(xiàn)Word轉(zhuǎn)PDF全攻略(建議收藏)
- Python實(shí)現(xiàn)Word批量轉(zhuǎn)PDF的小工具
- Python將Word文檔轉(zhuǎn)為PDF的兩種方法
- python實(shí)現(xiàn)word/excel/ppt批量轉(zhuǎn)pdf的示例代碼
- Python實(shí)現(xiàn)批量將word轉(zhuǎn)換成pdf
- Python實(shí)現(xiàn)批量word文檔轉(zhuǎn)pdf并統(tǒng)計(jì)其頁(yè)碼
- Python自動(dòng)化辦公之Word轉(zhuǎn)PDF的實(shí)現(xiàn)
- Python實(shí)現(xiàn)Word轉(zhuǎn)PDF全攻略(從入門(mén)到實(shí)戰(zhàn))
相關(guān)文章
python實(shí)現(xiàn)將json多行數(shù)據(jù)傳入到mysql中使用
這篇文章主要介紹了python實(shí)現(xiàn)將json多行數(shù)據(jù)傳入到mysql中使用,文中通過(guò)示例代碼介紹的非常詳細(xì),對(duì)大家的學(xué)習(xí)或者工作具有一定的參考學(xué)習(xí)價(jià)值,需要的朋友們下面隨著小編來(lái)一起學(xué)習(xí)學(xué)習(xí)吧2019-12-12
Python退出時(shí)強(qiáng)制運(yùn)行一段代碼的實(shí)現(xiàn)方法
這篇文章主要介紹了Python退出時(shí)強(qiáng)制運(yùn)行一段代碼,本文通過(guò)實(shí)例代碼給大家介紹的非常詳細(xì),對(duì)大家的學(xué)習(xí)或工作具有一定的參考借鑒價(jià)值,需要的朋友可以參考下2020-04-04
python 如何將帶小數(shù)的浮點(diǎn)型字符串轉(zhuǎn)換為整數(shù)
在python中如何實(shí)現(xiàn)將帶小數(shù)的浮點(diǎn)型字符串轉(zhuǎn)換為整數(shù)呢?今天小編就為大家介紹一下解決方案,希望對(duì)大家有所幫助。一起跟隨小編過(guò)來(lái)看看吧2021-05-05
利用pyproj將經(jīng)緯度投影為平面坐標(biāo)以及地理坐標(biāo)系背景知識(shí)解讀
這篇文章主要介紹了利用pyproj將經(jīng)緯度投影為平面坐標(biāo)以及地理坐標(biāo)系背景知識(shí)解讀,具有很好的參考價(jià)值,希望對(duì)大家有所幫助。如有錯(cuò)誤或未考慮完全的地方,望不吝賜教2023-06-06
python opencv 圖像拼接的實(shí)現(xiàn)方法
高級(jí)圖像拼接也叫作基于特征匹配的圖像拼接,拼接時(shí)消去兩幅圖像相同的部分,實(shí)現(xiàn)拼接合成全景圖。這篇文章主要介紹了python opencv 圖像拼接,需要的朋友可以參考下2019-06-06
Python之——生成動(dòng)態(tài)路由軌跡圖的實(shí)例
今天小編就為大家分享一篇Python之——生成動(dòng)態(tài)路由軌跡圖的實(shí)例,具有很好的參考價(jià)值,希望對(duì)大家有所幫助。一起跟隨小編過(guò)來(lái)看看吧2019-11-11

