使用python提取PowerPoint幻燈片中表格并保存到文本及Excel文件
引言
PowerPoint作為廣泛使用的演示工具,常被用于展示各類數(shù)據(jù)報告和分析結(jié)果,其中,表格以其直觀性和結(jié)構(gòu)性成為闡述數(shù)據(jù)關(guān)系的不二之選。然而,在數(shù)據(jù)分析、文檔歸檔或跨平臺分享的場景下,幻燈片中的表格功能難以滿足需求,提取其中表格并寫入其他文件是更好的處理方法。將表格內(nèi)容轉(zhuǎn)化為文本或Excel格式能夠促進(jìn)數(shù)據(jù)的快速流通與理解,同時也為自動化處理和進(jìn)一步的數(shù)據(jù)挖掘提供了便利。而使用Python能夠幫助我們更高效、精確地提取PowerPoint演示文稿中的表格,還可以實(shí)現(xiàn)表格提取的自動話進(jìn)行。本文將介紹如何使用Python來提取PowerPoint幻燈片中的表格,并將表格數(shù)據(jù)寫入文本文件以及Excel文件。
本文所使用的表格提取方法基于Spire.Presentation for Python,PyPI:pip install Spire.Presentation
。
用Python提取PPT表格并寫入文本文件
該庫中的ITable類表示演示文稿中的表格。我們可以遍歷演示文稿中的幻燈片,再遍歷幻燈片中的所有內(nèi)容對象(IShape實(shí)例),并判斷其是否為ITable實(shí)例,從而獲取演示文稿中的所有表格。獲取到表格之后,再使用ITable.TableRow[].TextFrame.Value屬性獲取表格單元格的數(shù)據(jù),即可實(shí)現(xiàn)表格的提取。以下是操作步驟:
- 導(dǎo)入所需模塊。
- 創(chuàng)建
Presentation
實(shí)例,使用Presentation.LoadFromFile()
方法載入PowerPoint文件。 - 遍歷幻燈片,再遍歷幻燈片中的內(nèi)容對象,判斷其是否為
ITable
實(shí)例。 - 遍歷
ITable
實(shí)例中的行,以及行中的單元格,使用TableRow[].TextFrame.Value
獲取單元格數(shù)據(jù)。 - 使用單元格數(shù)據(jù)構(gòu)建字符串,并寫入文本文件。
- 釋放資源。
代碼示例
from spire.presentation import * from spire.presentation.common import * # 創(chuàng)建一個Presentation實(shí)例 presentation = Presentation() # 加載PowerPoint文件 presentation.LoadFromFile("示例.pptx") tables = [] # 遍歷所有的幻燈片 for slide in presentation.Slides: # 遍歷所有的形狀 for shape in slide.Shapes: # 檢查形狀是否為表格 if isinstance(shape, ITable): tableData = "" # 遍歷所有的行 for row in shape.TableRows: rowData = "" # 遍歷行中的所有單元格 for i in range(0, row.Count): # 獲取單元格的值 cellValue = row[i].TextFrame.Text rowData += (cellValue + "\t" if i < row.Count - 1 else cellValue) tableData += (rowData + "\n") tables.append(tableData) # 將表格寫入文本文件 for idx, table in enumerate(tables, start=1): fileName = f"output/Tables/Table-{idx}.txt" with open(fileName, "w") as f: f.write(table) presentation.Dispose()
提取結(jié)果
用Python提取PPT表格并寫入Excel工作表
除了將提取到的表格數(shù)據(jù)寫入文本文件外,我們還可以使用Spire.XLS for Python(PyPI:pip install Spire.XLS
)將提取到的數(shù)據(jù)寫入到Excel工作表中,并進(jìn)行其他格式設(shè)置及文件轉(zhuǎn)換等操作。以下是操作步驟:
- 導(dǎo)入所需模塊。
- 創(chuàng)建
Presentation
實(shí)例,使用Presentation.LoadFromFile()
方法載入PowerPoint文件。 - 創(chuàng)建
Workbook
對象從而新建一個Excel工作簿,使用Workbook.Worksheets.Clear()
方法清除工作簿中的默認(rèn)工作表。 - 遍歷幻燈片,再遍歷幻燈片中的內(nèi)容對象,判斷其是否為
ITable
實(shí)例。將ITable
實(shí)例添加到列表中。 - 遍歷列表中的
ITable
實(shí)例,使用Workbook.Worksheets.Add()
方法為每個ITable
實(shí)例創(chuàng)建一個工作表。 - 遍歷
ITable
實(shí)例中的行以及行中的單元格,使用TableRow[].TextFrame.Value
獲取單元格數(shù)據(jù),再使用Worksheet.Range[].Value
屬性將數(shù)據(jù)寫入到工作表中的對應(yīng)單元格。 - 進(jìn)行工作表格式設(shè)置。
- 保存Excel工作簿,或?qū)⑵滢D(zhuǎn)換為其他格式的文件。
- 釋放資源。
代碼示例
from spire.presentation import * from spire.presentation.common import * from spire.xls import * from spire.xls.common import * # 創(chuàng)建一個Presentation實(shí)例 presentation = Presentation() # 加載PowerPoint文件 presentation.LoadFromFile("示例.pptx") # 創(chuàng)建一個Excel文件并清除默認(rèn)工作表 workbook = Workbook() workbook.Worksheets.Clear() tables = [] # 遍歷所有的幻燈片 for slide in presentation.Slides: # 遍歷所有的形狀 for shape in slide.Shapes: # 檢查形狀是否為表格 if isinstance(shape, ITable): tables.append(shape) # 遍歷所有的表格 for t in range(len(ttables)): table = tables[t] sheet = workbook.Worksheets.Add(f"Sheet-{t+1}") for i in range(0, table.TableRows.Count): row = table.TableRows[i] for j in range(0, row.Count): sheet.Range[i + 1, j + 1].Value = row[j].TextFrame.Text # 自動調(diào)整行和列的大小 sheet.AllocatedRange.Style.Font.FontName = "HarmonyOS Sans SC" sheet.AllocatedRange.Style.Font.Size = 12.0 sheet.AllocatedRange.AutoFitColumns() sheet.AllocatedRange.AutoFitRows() # 保存Excel文件 workbook.SaveToFile("output/PresentationTables.xlsx", FileFormat.Version2016) presentation.Dispose() workbook.Dispose()
提取結(jié)果
本文介紹了如何使用Python提取PowerPoint演示文稿中的表格數(shù)據(jù),并寫入文本文件或Excel工作簿。
到此這篇關(guān)于使用python提取PowerPoint幻燈片中表格并保存到文本及Excel文件的文章就介紹到這了,更多相關(guān)python提取PowerPoint中表格內(nèi)容請搜索腳本之家以前的文章或繼續(xù)瀏覽下面的相關(guān)文章希望大家以后多多支持腳本之家!
相關(guān)文章
集調(diào)試共享及成本控制Prompt工具PromptLayer使用指南
這篇文章主要介紹了集調(diào)試共享及成本控制Prompt工具PromptLayer使用指南,有需要的朋友可以借鑒參考下,希望能夠有所幫助,祝大家多多進(jìn)步,早日升職加薪2023-03-03Anaconda安裝時默認(rèn)python版本改成其他版本的兩種方式
這篇文章主要給大家介紹了關(guān)于Anaconda安裝時默認(rèn)python版本改成其他版本的兩種方式,anaconda是一個非常好用的python發(fā)行版本,其中包含了大部分常用的庫,需要的朋友可以參考下2023-10-10Python 用turtle實(shí)現(xiàn)用正方形畫圓的例子
今天小編就為大家分享一篇Python 用turtle實(shí)現(xiàn)用正方形畫圓的例子,具有很好的參考價值,希望對大家有所幫助。一起跟隨小編過來看看吧2019-11-11利用Python封裝MySQLHelper類實(shí)現(xiàn)數(shù)據(jù)庫的增刪改查功能
Python 連接 MySQL 的方法有很多,常用的有 pymysql 和 mysql-connector-python 兩種庫,本文主要介紹了如何封裝一個MySQLHelper類,實(shí)現(xiàn)對數(shù)據(jù)庫的增刪改查功能,感興趣的可以了解一下2023-06-06