Python 自動(dòng)化修改word的案例
前言
利用Python docx模塊,可以很方便地打開和修改Word 2007及以后的文檔。本文簡單地介紹了如何使用python修改word文檔中的內(nèi)容。
例子與代碼
word文檔的內(nèi)容是一封表揚(yáng)信,內(nèi)容見下圖:
表揚(yáng)信.png
現(xiàn)在需要通過python對,”表揚(yáng)信.docx”文檔進(jìn)行修改,需要修改的地方已在圖中標(biāo)記出。
1、第一個(gè)箭頭處,首行縮進(jìn)2字符
2、第二個(gè)箭頭處,對段落進(jìn)行左縮進(jìn)2字符,并添加“向小z同學(xué)學(xué)習(xí)!”
3、第三個(gè)和第四個(gè)箭頭處,進(jìn)行右對齊,并右縮進(jìn)2cm
4、趙東來,修改為小z
5、陸亦可,修改為大Z
6、她,修改為他
7、狗糧,修改為貓糧
代碼如下:
from docx import Document from docx.shared import Cm from docx.enum.text import WD_ALIGN_PARAGRAPH import re document=Document(r"g:\CS\Python Scripts\表揚(yáng)信.docx") # 首先對段落格式進(jìn)行修改,docx默認(rèn)標(biāo)題也屬于段落,因此“表揚(yáng)信”是第一段 paragraphs=document.paragraphs paragraphs[2].paragraph_format.first_line_indent=Cm(0.74) paragraphs[3].paragraph_format.left_indent=Cm(0.74) paragraphs[4].paragraph_format.alignment=WD_ALIGN_PARAGRAPH.RIGHT paragraphs[4].paragraph_format.right_indent=Cm(2) paragraphs[5].paragraph_format.alignment=WD_ALIGN_PARAGRAPH.RIGHT paragraphs[5].paragraph_format.right_indent=Cm(2) # 對文本進(jìn)行修改 # 修改第二段 paragraphs[1].text="小Z同學(xué):" # 將第三段陸亦可替換為大Z,她替換為他。通過python的正則表達(dá)式,可以很簡單地實(shí)現(xiàn)文本的替換和查找。 text=re.sub('陸亦可','大Z',paragraphs[2].text) text=re.sub('她','他',text) paragraphs[2].text=text # 在第四段后面加上 paragraphs[3].add_run("向小z同學(xué)學(xué)習(xí)!") # 修改表格里面的內(nèi)容 tables=document.tables tables[0].cell(1,0).text="貓糧" tables[0].cell(2,0).text="貓糧" tables[0].cell(3,0).text="貓糧" # 插入一張圖片,圖片寬度設(shè)置為11.8cm document.add_picture('fun.jpg', width=Cm(11.8)) document.save()
運(yùn)行代碼,結(jié)果見下圖:
修改后.png
本文對word文檔中的內(nèi)容主要在如下幾方面進(jìn)行了修改:
段落文字的替換和添加
段落排列的對齊和縮進(jìn)
表格文字的修改
在文檔中插入圖片
docx模塊功能強(qiáng)大,還支持對word文檔,字體、顏色、樣式、章節(jié)、分頁符、制表位等的修改。通過python批量化操作word文檔,可以有效地節(jié)省時(shí)間,告別繁瑣重復(fù)的工作。
結(jié)論
通過對word文檔段落、表格和圖片的操作,結(jié)合python的正則表達(dá)式,目前,可以想到的能實(shí)現(xiàn)的功能如下:
1、批量制作word名片、信件、通知等(功能與word郵件合并功能類似)
2、對多個(gè)文檔的內(nèi)容進(jìn)行一鍵提取和替換
3、通過docx模塊,python將Excel、郵件、網(wǎng)頁、matplotlib、支持python接口的軟件等資源整合在一起,提取相關(guān)信息,自動(dòng)生成word報(bào)告
4、在女朋友面前裝逼
后續(xù)有時(shí)間,將對docx模塊中的paragraph(段落)、table(表格)等對象進(jìn)行詳細(xì)的介紹。
補(bǔ)充:Python修改Word文檔內(nèi)容和插入圖片
代碼如下
#!/usr/bin/python # coding:utf-8 import docx def main(): filepath = 'test.docx' filepath1 = 'wtest.docx' newdocx = docx.Document(filepath) table = newdocx.tables for oTable in table: rows_num = len(oTable.rows) columns_num = len(oTable.columns) cell = oTable.cell(3, 0) # cell.add_paragraph("a") cell.text = "" cell.paragraphs[-1].runs[0].add_picture('t1.jpg') print(rows_num) print(columns_num) newdocx.save(filepath1) if __name__ == '__main__': main()
以上為個(gè)人經(jīng)驗(yàn),希望能給大家一個(gè)參考,也希望大家多多支持腳本之家。如有錯(cuò)誤或未考慮完全的地方,望不吝賜教。
相關(guān)文章
讓Django支持Sql Server作后端數(shù)據(jù)庫的方法
今天小編就為大家分享一篇讓Django支持Sql Server作后端數(shù)據(jù)庫的方法,具有很好的參考價(jià)值,希望對大家有所幫助。一起跟隨小編過來看看吧2018-05-05利用python實(shí)現(xiàn)數(shù)據(jù)分析
為什么要利用python進(jìn)行數(shù)據(jù)分析?python擁有一個(gè)巨大的活躍的科學(xué)計(jì)算社區(qū),擁有不斷改良的庫,能夠輕松的集成C,C++,Fortran代碼(Cython項(xiàng)目),可以同時(shí)用于研究和原型的構(gòu)建以及生產(chǎn)系統(tǒng)的構(gòu)建。2017-01-01Python獲取當(dāng)前頁面內(nèi)所有鏈接的四種方法對比分析
這篇文章主要介紹了Python獲取當(dāng)前頁面內(nèi)所有鏈接的方法,結(jié)合實(shí)例形式對比分析了Python常用的四種獲取頁面鏈接的方法,并附帶了iframe框架內(nèi)鏈接的獲取方法,需要的朋友可以參考下2017-08-08python中nuitka使用程序打包的實(shí)現(xiàn)
本文主要介紹了python中nuitka使用程序打包的實(shí)現(xiàn),文中通過示例代碼介紹的非常詳細(xì),對大家的學(xué)習(xí)或者工作具有一定的參考學(xué)習(xí)價(jià)值,需要的朋友們下面隨著小編來一起學(xué)習(xí)學(xué)習(xí)吧2025-04-04Python入門_淺談數(shù)據(jù)結(jié)構(gòu)的4種基本類型
下面小編就為大家?guī)硪黄狿ython入門_淺談數(shù)據(jù)結(jié)構(gòu)的4種基本類型。小編覺得挺不錯(cuò)的,現(xiàn)在就分享給大家,也給大家做個(gè)參考。一起跟隨小編過來看看吧2017-05-05Python面向?qū)ο蟪绦蛟O(shè)計(jì)之繼承、多態(tài)原理與用法詳解
這篇文章主要介紹了Python面向?qū)ο蟪绦蛟O(shè)計(jì)之繼承、多態(tài),結(jié)合實(shí)例形式分析了Python面向?qū)ο蟪绦蛟O(shè)計(jì)中繼承、多態(tài)的相關(guān)概念、原理、用法及操作注意事項(xiàng),需要的朋友可以參考下2020-03-03