Python進(jìn)行word模板內(nèi)容替換的實(shí)現(xiàn)示例
技術(shù)背景與需求場景
- Word模板在辦公自動(dòng)化中的重要性
- Python處理Word文檔的常見需求(批量生成報(bào)告、合同等)
- 傳統(tǒng)手動(dòng)替換的局限性及自動(dòng)化解決方案的優(yōu)勢
核心工具庫介紹
python-docx
:基礎(chǔ)讀寫操作,但默認(rèn)不支持模板變量替換docxtpl
:基于python-docx
的擴(kuò)展,支持Jinja2模板語法mailmerge
:適用于簡單郵件合并場景- 其他可選庫(如
docx-mailmerge
)的簡要對(duì)比
這里作者平常主要使用的是python-docx的方式,這里給大家提供一些常用word模板內(nèi)容替換的方法及可能用到的函數(shù)
1.獲取你的word模板內(nèi)容
簡單粗暴的方式,可以直接幫你看到你的模板每一個(gè)內(nèi)容的數(shù)據(jù)及占位點(diǎn)(索引),其中當(dāng)數(shù)據(jù)為字符串的內(nèi)容,大多是直接展示,而當(dāng)你看到某一個(gè)數(shù)據(jù)的為 " "字符串時(shí),此時(shí)注意觀察你模板中的上下文,該位置可能表示了你模板中的表格或者圖形的占位(先記住,后面會(huì)用到?。。?/p>
def run(): text0 = doc.paragraphs[0].text text1 = doc.paragraphs[1].text text2 = doc.paragraphs[2].text ... if __name__ == '__main__': run()
2.正常文本內(nèi)容的替換
當(dāng)我們發(fā)現(xiàn)我們需要替換一段文字的時(shí)候,首先找到該段文字表示的位置,假如
text0 = doc.paragraphs[0].text 此時(shí)是一段文字
# 省略導(dǎo)包,根據(jù)代碼缺失的去安裝 new_file_path = 'xxx' # 文件路徑 doc = Document(new_file_path) paragraphs_1_text = '這是我要替換的文字' # 通用替換文本方式 def replace_paragraph_text(paragraph, new_text): """可以在該方法下新增對(duì)特定段落的額外處理""" # 遍歷段落中的所有 runs for run in paragraph.runs: run.text = "" # 清空每個(gè) run 的文本 # 將新文本插入到第一個(gè) run 中,保留樣式 paragraph.runs[0].text = new_text if __name__ == '__main__': text0 = "這是原來的文字" # 假設(shè)你的text0是這段文字 replace_paragraph_text(doc.paragraphs[0], paragraphs_1_text) # doc.paragraphs[0]為你段落的位置, paragraphs_1_text則是要替換的文本。 """ 使用該方式即可替換所有文字的段落 """
3.表格內(nèi)容的替換
當(dāng)發(fā)現(xiàn)我上面說的那種數(shù)據(jù)為空字符串的時(shí)候,而且你在模板中發(fā)現(xiàn)其為表格,就可以使用我下面的方式進(jìn)行替換,一般表格的替換比較特殊,tables0 = doc.tables[xxx]來寫表格的索引,可以不用去看段落的索引,而是根據(jù)你模板中的表格的數(shù)量索引來看,第一個(gè)表格索引就是0,以此類推。
tables0 = doc.tables[xxx] # 寫你表格索引 def set_font_table(para, font_name="仿宋", font_size=12, char_spacing=None, bold=True): """ 設(shè)置段落的字體為指定字體和大小,并可設(shè)置字間距,同時(shí)支持加粗 """ for run in para.runs: run.font.name = font_name run.font.size = Pt(font_size) run.font.bold = bold # 設(shè)置加粗 if char_spacing: run.font.spacing = char_spacing """ 可選部分,看是否刪除表的數(shù)據(jù) """ #for row_index in range(len(tables0.rows)-1, 0, -1): # 從最后一行開始刪除到第二行 # if row_index > 0: # 確保不刪除表頭行(假設(shè)表頭是第一行) # tables0._element.remove(tables8.rows[row_index]._element) # 根據(jù) table_data 重新添加行和填充數(shù)據(jù) #for row_index, row_data in enumerate(table_data, start=1): # 從第二行開始 # # row = tables0.add_row() # 添加新的一行(根據(jù)上面是否刪除表選擇解注) # for col_index in range(min(column_count, len(row_data))): # 保證不會(huì)超出列數(shù)范圍 # cell = row.cells[col_index] # cell.text = str(row_data[col_index]) # for para in cell.paragraphs: # set_font_table(para, font_name="仿宋", font_size=12, bold=False) # para.alignment = WD_ALIGN_PARAGRAPH.CENTER # 常用部分 new_table_data = [[]] # 通常是這個(gè)格式,里面的每個(gè)[]存每一行表格數(shù)據(jù) for row_index, row_data in enumerate(new_table_data, start=1): # 從第二行開始 for col_index, cell_data in enumerate(row_data, start=0): # 從第一列開始 # 獲取每個(gè)單元格 cell = tables0.cell(row_index, col_index) cell.text = str(cell_data) for para in cell.paragraphs: set_font_table(para, font_name="仿宋", font_size=12, bold=False) para.alignment = WD_ALIGN_PARAGRAPH.CENTER
一般通過上述方式可完成替換表格內(nèi)容
4.圖形內(nèi)容的替換
首先需要用python的plt 方法進(jìn)行生成圖型(柱狀圖、折線圖等),生成圖形這部分代碼省略,這里主要講下如何進(jìn)行段落替換,直接上代碼:
chart_image_path = generate_bar_chart(數(shù)據(jù)內(nèi)容, 地址) # 通過一個(gè)方法獲取生成的柱狀圖地址 target_paragraph = doc.paragraphs[xxx] # 通過你的上下文段落來判斷這里是否是一個(gè)圖形,找出其對(duì)應(yīng)的索引 old_inline = None for element in target_paragraph._element.findall('.//wp:inline', namespaces={'wp': 'http://schemas.openxmlformats.org/drawingml/2006/wordprocessingDrawing'}): # for element in target_paragraph._element.iter(): if element.tag.endswith("inline"): # 檢查是否是 <wp:inline> 元素 old_inline = element break from docx.shared import Inches # 如果找到舊的 <wp:inline> 對(duì)象 if old_inline is not None: # 插入新圖片并獲取其 <wp:inline> 對(duì)象 new_run = target_paragraph.add_run() new_inline = new_run.add_picture(chart_image_path, width=Inches(5.5))._inline # 替換舊的 <wp:inline> 對(duì)象 parent = old_inline.getparent() parent.replace(old_inline, new_inline) # 刪除新插入的 run(因?yàn)槲覀円呀?jīng)替換了舊的 <wp:inline>) target_paragraph._p.remove(new_run._element)
通常處理這樣的word模板,是為了從某一數(shù)據(jù)源中,固定時(shí)間的獲取某些數(shù)據(jù)來替換模板生成我們想要的報(bào)告文檔之類的東西,為了實(shí)現(xiàn)自動(dòng)化,該替換代碼,通常在完成后,會(huì)與定時(shí)任務(wù)相關(guān)的東西相結(jié)合來使用。作者這里常用的是crontab來進(jìn)行定時(shí)任務(wù),大家可以借鑒或者是采取自己適合的方式進(jìn)行處理。
到此這篇關(guān)于Python進(jìn)行word模板內(nèi)容替換的實(shí)現(xiàn)示例的文章就介紹到這了,更多相關(guān)Python word模板內(nèi)容替換內(nèi)容請(qǐng)搜索腳本之家以前的文章或繼續(xù)瀏覽下面的相關(guān)文章希望大家以后多多支持腳本之家!
相關(guān)文章
Python基于pip實(shí)現(xiàn)離線打包過程詳解
這篇文章主要介紹了Python基于pip實(shí)現(xiàn)離線打包過程詳解,文中通過示例代碼介紹的非常詳細(xì),對(duì)大家的學(xué)習(xí)或者工作具有一定的參考學(xué)習(xí)價(jià)值,需要的朋友可以參考下2020-05-05python里讀寫excel等數(shù)據(jù)文件的6種常用方式(小結(jié))
這篇文章主要介紹了python里讀寫excel等數(shù)據(jù)文件的6種常用方式(小結(jié)),文中通過示例代碼介紹的非常詳細(xì),對(duì)大家的學(xué)習(xí)或者工作具有一定的參考學(xué)習(xí)價(jià)值,需要的朋友們下面隨著小編來一起學(xué)習(xí)學(xué)習(xí)吧2021-04-04詳解python列表(list)的使用技巧及高級(jí)操作
這篇文章主要介紹了詳解python列表(list)的使用技巧及高級(jí)操作,文中通過示例代碼介紹的非常詳細(xì),對(duì)大家的學(xué)習(xí)或者工作具有一定的參考學(xué)習(xí)價(jià)值,需要的朋友們下面隨著小編來一起學(xué)習(xí)學(xué)習(xí)吧2019-08-08pycharm與jupyter?lab/notebook結(jié)合使用方式
這篇文章主要介紹了pycharm與jupyter?lab/notebook結(jié)合使用方式,具有很好的參考價(jià)值,希望對(duì)大家有所幫助,如有錯(cuò)誤或未考慮完全的地方,望不吝賜教2024-06-06