Python實(shí)現(xiàn)PDF轉(zhuǎn)為Excel的示例講解
PDF文件是一種靜態(tài)文檔格式,通常難以編輯,而Excel則是一個靈活的表格工具。如果你需要處理PDF表格中的數(shù)據(jù),那么將其導(dǎo)出為Excel文件可以大大節(jié)省工作時間和精力。Excel提供的強(qiáng)大數(shù)據(jù)編輯和格式化功能,允許你對轉(zhuǎn)換后的PDF數(shù)據(jù)進(jìn)行修改、排序、篩選、計算等操作。同時,你還可以調(diào)整單元格大小、更改字體、應(yīng)用樣式等。本文將提供在Python中將PDF表格轉(zhuǎn)換為Excel文件的解決方案。
一、環(huán)境準(zhǔn)備
需要先安裝Spire.PDF for Python庫來幫助實(shí)現(xiàn)PDF轉(zhuǎn)Excel??梢酝ㄟ^以下pip命令安裝:(或參考 如何在 VS Code 中安裝 Spire.PDF for Python)
pip install Spire.PDF
二、Python 將PDF轉(zhuǎn)為Excel 實(shí)現(xiàn)步驟
1. 加載PDF文檔。
2. 創(chuàng)建 XlsxLineLayoutOptions 類的對象來指定轉(zhuǎn)換選項。
3. 應(yīng)用上述設(shè)置的轉(zhuǎn)換選項,然后使用 PdfDocument.SaveToFile() 將PDF文件保存為Excel xlsx表格。
其中XlsxLineLayoutOptions類的構(gòu)造函數(shù)接受以下5個參數(shù):
參數(shù) | 描述 |
convertToMultipleSheet (bool) | 表示是否將多個 PDF 頁面渲染到一個 Excel 工作表中 |
rotatedText (bool) | 表示是否顯示旋轉(zhuǎn)的文本 |
splitCell (bool) | 表示一個包含多行文本的 PDF 表格單元格是否會在 Excel 中被拆分成多行 |
wrapText (bool) | 表示是否對 Excel 單元格中的文本進(jìn)行換行 |
overlapText (bool) | 表示是否顯示重疊的文本 |
三、測試代碼
from spire.pdf.common import * from spire.pdf import * # 創(chuàng)建PdfDocument對象 pdf = PdfDocument() # 加載PDF文檔 pdf.LoadFromFile("數(shù)據(jù).pdf") # 創(chuàng)建 XlsxLineLayoutOptions 對象來指定轉(zhuǎn)換選項 convertOptions = XlsxLineLayoutOptions(True, True, False, True, False) # 設(shè)置轉(zhuǎn)換選項 pdf.ConvertOptions.SetPdfToXlsxOptions(convertOptions) # 將PDF文檔保存為Excel XLSX格式 pdf.SaveToFile("Pdf轉(zhuǎn)Excel.xlsx", FileFormat.XLSX) pdf.Close()
轉(zhuǎn)換結(jié)果:
到此這篇關(guān)于Python實(shí)現(xiàn)PDF轉(zhuǎn)為Excel的示例講解的文章就介紹到這了,更多相關(guān)Python PDF轉(zhuǎn)Excel內(nèi)容請搜索腳本之家以前的文章或繼續(xù)瀏覽下面的相關(guān)文章希望大家以后多多支持腳本之家!
相關(guān)文章
python 環(huán)境安裝及編輯器配置方法小結(jié)
這篇文章主要介紹了python 環(huán)境安裝及編輯器配置方法小結(jié)的相關(guān)資料,需要的朋友可以參考下2021-06-06django echarts餅圖數(shù)據(jù)動態(tài)加載的實(shí)例
今天小編就為大家分享一篇django echarts餅圖數(shù)據(jù)動態(tài)加載的實(shí)例,具有很好的參考價值,希望對大家有所幫助。一起跟隨小編過來看看吧2019-08-08python opencv實(shí)現(xiàn)gif圖片分解的示例代碼
這篇文章主要介紹了python opencv實(shí)現(xiàn)gif圖片分解的示例代碼,文中通過示例代碼介紹的非常詳細(xì),對大家的學(xué)習(xí)或者工作具有一定的參考學(xué)習(xí)價值,需要的朋友們下面隨著小編來一起學(xué)習(xí)學(xué)習(xí)吧2019-12-12python獲取網(wǎng)頁中所有圖片并篩選指定分辨率的方法
下面小編就為大家分享一篇python獲取網(wǎng)頁中所有圖片并篩選指定分辨率的方法,具有很好的參考價值,希望對大家有所幫助。一起跟隨小編過來看看吧2018-03-03一小時學(xué)會TensorFlow2之基本操作2實(shí)例代碼
這篇文章主要介紹了TensorFlow2的基本操作和實(shí)例代碼,本文給大家介紹的非常詳細(xì),對大家的學(xué)習(xí)或工作具有一定的參考借鑒價值,需要的朋友可以參考下2021-09-09在交互式環(huán)境中執(zhí)行Python程序過程詳解
這篇文章主要介紹了在交互式環(huán)境中執(zhí)行Python程序過程詳解,運(yùn)行Python腳本程序的方式有多種,目前主要的方式有:交互式環(huán)境運(yùn)行、命令行窗口運(yùn)行、開發(fā)工具上運(yùn)行等,其中在不同的操作平臺上還互不相同,需要的朋友可以參考下2019-07-07Python3實(shí)現(xiàn)的判斷環(huán)形鏈表算法示例
這篇文章主要介紹了Python3實(shí)現(xiàn)的判斷環(huán)形鏈表算法,涉及Python針對環(huán)形鏈表的遍歷、判斷相關(guān)操作技巧,需要的朋友可以參考下2019-03-03python判斷一個數(shù)是否能被另一個整數(shù)整除的實(shí)例
今天小編就為大家分享一篇python判斷一個數(shù)是否能被另一個整數(shù)整除的實(shí)例,具有很好的參考價值,希望對大家有所幫助。一起跟隨小編過來看看吧2018-12-12快速了解Python開發(fā)環(huán)境Spyder
這篇文章主要介紹了Python開發(fā)環(huán)境Spyder的的相關(guān)資料,幫助大家更快的上手Spyder,感興趣的朋友可以了解下2020-06-06