利用python代碼管理Word文檔屬性信息
引言
在Word文檔管理中,文檔屬性包含與文檔有關(guān)的關(guān)鍵信息,如標(biāo)題、作者、創(chuàng)建日期等,是進(jìn)行文檔管理的重要工具。這些屬性不僅有助于我們組織和分類文件,提高工作效率,還便于在海量數(shù)據(jù)中進(jìn)行快速檢索與歸檔。因此,能夠自動(dòng)化地設(shè)置、讀取及刪除這些文檔屬性信息,對(duì)于提升文檔處理的效率與精確度尤為重要。Python為我們提供了便捷的手段來(lái)實(shí)現(xiàn)對(duì)Word文檔屬性的高效管理。本文將展示如何利用Python代碼來(lái)靈活操控Word文檔的屬性信息,從而滿足個(gè)性化與批量化文檔處理的需求。
本文所使用的方法需要用到Spire.Doc for Python,PyPI:pip install Spire.Doc
。
用Python設(shè)置Word文檔內(nèi)置屬性
我們可以使用庫(kù)中提供的 Document.BuilinDocumentProperties 屬性來(lái)訪問(wèn)文檔的內(nèi)置文檔屬性,并通過(guò) BuilinDocumentProperties 下的各屬性來(lái)對(duì)文檔屬性進(jìn)行設(shè)置。以下是操作步驟:
- 導(dǎo)入所需模塊。
- 創(chuàng)建 Document 類實(shí)例,并使用 Document.LoadFromFile() 方法載入Word文檔。
- 利用 Document.BuilinDocumentProperties 屬性獲取文檔的內(nèi)置文檔屬性。
- 利用 BuilinDocumentProperties 下的各屬性設(shè)置文檔內(nèi)置屬性信息。
- 使用 Document.SaveToFile() 方法保存Word文檔。
- 釋放資源。
代碼示例:
from spire.doc import * from spire.doc.common import * # 創(chuàng)建Document類實(shí)例 doc = Document() # 載入Word文檔 doc.LoadFromFile("Sample.docx") # 設(shè)置文檔預(yù)設(shè)屬性 builtinProperty = doc.BuiltinDocumentProperties builtinProperty.Title = "人工智能革命" builtinProperty.Subject = "人工智能中神經(jīng)網(wǎng)絡(luò)的高級(jí)應(yīng)用和未來(lái)方向" builtinProperty.Author = "西蒙" builtinProperty.Manager = "艾莉" builtinProperty.Company = "AI研究工作室" builtinProperty.Category = "研究" builtinProperty.Keywords = "機(jī)器學(xué)習(xí);神經(jīng)網(wǎng)絡(luò);人工智能" builtinProperty.Comments = "本文介紹的是人工智能的發(fā)展現(xiàn)狀。" builtinProperty.HyperLinkBase = "www.e-iceblue.com" # Save the document doc.SaveToFile("output/添加內(nèi)置文檔屬性到Word文檔.docx", FileFormat.Docx2019) doc.Close()
結(jié)果文檔:
用Python讀取Word文檔內(nèi)置屬性
除了添加屬性值外,BuiltinDocumentProperties 類下的屬性還使開發(fā)者能夠讀取Word文檔的現(xiàn)有內(nèi)置屬性。這支持了多種功能,如文檔搜索、信息提取及文檔分析。
使用Python讀取文檔內(nèi)置屬性的具體步驟如下:
- 導(dǎo)入所需模塊。
- 創(chuàng)建一個(gè)Document類的對(duì)象,并使用 Document.LoadFromFile() 方法加載一個(gè)Word文檔。
- 通過(guò) Document.BuiltinDocumentProperties 屬性獲取文檔的內(nèi)置屬性。
- 利用 BuiltinDocumentProperties 類下的各屬性獲取其值。
- 輸出文檔的內(nèi)置屬性信息。
代碼示例:
from spire.doc import * from spire.doc.common import * # 創(chuàng)建Document類實(shí)例 doc = Document() # 載入Word文檔 doc.LoadFromFile("output/添加內(nèi)置文檔屬性到Word文檔.docx") # 獲取文檔預(yù)設(shè)屬性 builtinProperties = doc.BuiltinDocumentProperties # 獲取文檔預(yù)設(shè)屬性信息 properties = [ "作者:" + builtinProperties.Author, "單位:" + builtinProperties.Company, "標(biāo)題:" + builtinProperties.Title, "主題:" + builtinProperties.Subject, "關(guān)鍵詞:" + builtinProperties.Keywords, "類別:" + builtinProperties.Category, "主管:" + builtinProperties.Manager, "備注:" + builtinProperties.Comments, "超鏈接基礎(chǔ):" + builtinProperties.HyperLinkBase, "字?jǐn)?shù):" + str(builtinProperties.WordCount), "頁(yè)數(shù):" + str(builtinProperties.PageCount), ] # 輸出預(yù)設(shè)屬性信息 for i in range(0, len(properties)): print(properties[i]) doc.Close()
結(jié)果文檔:
用Python刪除Word文檔內(nèi)置屬性
如果需要在分享文檔時(shí)保護(hù)隱私,移除敏感信息,我們可以通過(guò)將文檔屬性設(shè)置為空值來(lái)移除文檔屬性信息。以下是操作步驟:
- 導(dǎo)入所需模塊。
- 創(chuàng)建一個(gè) Document 類的實(shí)例,并使用Document.LoadFromFile() 方法加載一個(gè)Word文檔。
- 通過(guò) Document.BuiltinDocumentProperties 屬性獲取文檔的內(nèi)置屬性。
- 將某些屬性的值設(shè)置為None以移除這些屬性,利用 BuiltinDocumentProperties 類下的相應(yīng)屬性進(jìn)行操作。
- 使用 Document.SaveToFile() 方法保存文檔。
- 釋放資源。
代碼示例:
from spire.doc import * from spire.doc.common import * # 創(chuàng)建Document類實(shí)例 doc = Document() # 載入Word文檔 doc.LoadFromFile("output/添加內(nèi)置文檔屬性到Word文檔.docx") # 獲取文檔的預(yù)設(shè)屬性 builtinProperties = doc.BuiltinDocumentProperties # 通過(guò)將屬性設(shè)置為空來(lái)移除預(yù)設(shè)屬性 builtinProperties.Author = None builtinProperties.Company = None builtinProperties.Title = None builtinProperties.Subject = None builtinProperties.Keywords = None builtinProperties.Comments = None builtinProperties.Category = None builtinProperties.Manager = None # 保存文檔 doc.SaveToFile("output/移除Word文檔預(yù)設(shè)屬性.docx", FileFormat.Docx) doc.Close()
本文演示了如何使用Python對(duì)文檔文檔內(nèi)置文檔屬性進(jìn)行設(shè)置、讀取以及刪除。
到此這篇關(guān)于利用python代碼管理Word文檔屬性信息的文章就介紹到這了,更多相關(guān)python管理Word屬性內(nèi)容請(qǐng)搜索腳本之家以前的文章或繼續(xù)瀏覽下面的相關(guān)文章希望大家以后多多支持腳本之家!
相關(guān)文章
基于Python實(shí)現(xiàn)圍棋游戲的示例代碼
今天給大家?guī)?lái)一期圍棋的源碼分享。下面我們先看看效果。游戲進(jìn)去默認(rèn)為九路玩法,當(dāng)然也可以選擇十三路或是十九路玩法,感興趣的可以了解一下2022-05-05python 輸入字符串生成所有有效的IP地址(LeetCode 93號(hào)題)
這篇文章主要介紹了python 生成所有有效的IP地址的方法,幫助大家解答題目,學(xué)習(xí)python,感興趣的朋友可以了解下2020-10-10Python和Pycharm 環(huán)境部署詳細(xì)步驟
Python環(huán)境搭建過(guò)程很多朋友都操作過(guò),本次我們將向大家介紹Python和Pycharm 環(huán)境部署的流程,文章通過(guò)圖文的形式給大家展示一目了然一看就懂,需要的朋友參考下吧2021-06-06對(duì)python3中的RE(正則表達(dá)式)-詳細(xì)總結(jié)
今天小編就為大家分享一篇對(duì)python3中的RE(正則表達(dá)式)-詳細(xì)總結(jié),具有很好的參考價(jià)值,希望對(duì)大家有所幫助。一起跟隨小編過(guò)來(lái)看看吧2019-07-07Python 實(shí)現(xiàn)鏈表實(shí)例代碼
這篇文章主要介紹了Python 實(shí)現(xiàn)鏈表實(shí)例代碼的相關(guān)資料,需要的朋友可以參考下2017-04-04Python光學(xué)仿真wxpython透鏡演示系統(tǒng)框架
這篇文章主要為大家介紹了Python光學(xué)仿真UI界面的wxpython透鏡演示系統(tǒng)框架基本講解,有需要的朋友可以借鑒參考下,希望能夠有所幫助2021-10-10基于python?win32setpixel?api?實(shí)現(xiàn)計(jì)算機(jī)圖形學(xué)相關(guān)操作(推薦)
這篇文章主要介紹了基于python?win32setpixel?api?實(shí)現(xiàn)計(jì)算機(jī)圖形學(xué)相關(guān)操作,這次的主要分為2個(gè)主要模塊,一個(gè)是實(shí)現(xiàn)畫線,畫圓的算法,還有填充的算法,以及裁剪的算法,需要的朋友可以參考下2021-12-12python數(shù)據(jù)提取BeautifulSoup的概念語(yǔ)法及使用優(yōu)點(diǎn)詳解
這篇文章主要為大家介紹了python數(shù)據(jù)提取BeautifulSoup概念語(yǔ)法及使用優(yōu)點(diǎn)詳解,有需要的朋友可以借鑒參考下,希望能夠有所幫助,祝大家多多進(jìn)步,早日升職加薪2024-02-02