Python使用python-docx讀寫word文檔
python-docx庫可用于創(chuàng)建和編輯Microsoft Word(.docx)文件。
官方文檔:鏈接地址
備注:
doc是微軟的專有的文件格式,docx是Microsoft Office2007之后版本使用,其基于Office Open XML標準的壓縮文件格式,比 doc文件所占用空間更小。docx格式的文件本質(zhì)上是一個ZIP文件,所以其實也可以把.docx文件直接改成.zip,解壓后,里面的 word/document.xml包含了Word文檔的大部分內(nèi)容,圖片文件則保存在word/media里面。
python-docx不支持.doc文件,間接解決方法是在代碼里面先把.doc轉(zhuǎn)為.docx。
一、安裝包
pip3 install python-docx
二、創(chuàng)建word文檔
下面是在官文示例基礎(chǔ)上對個別地方稍微修改,并加上函數(shù)的使用說明
from docx import Document from docx.shared import Inches document = Document() #添加標題,并設(shè)置級別,范圍:0 至 9,默認為1 document.add_heading('Document Title', 0) #添加段落,文本可以包含制表符(\t)、換行符(\n)或回車符(\r)等 p = document.add_paragraph('A plain paragraph having some ') #在段落后面追加文本,并可設(shè)置樣式 p.add_run('bold').bold = True p.add_run(' and some ') p.add_run('italic.').italic = True document.add_heading('Heading, level 1', level=1) document.add_paragraph('Intense quote', style='Intense Quote') #添加項目列表(前面一個小圓點) document.add_paragraph( 'first item in unordered list', style='List Bullet' ) document.add_paragraph('second item in unordered list', style='List Bullet') #添加項目列表(前面數(shù)字) document.add_paragraph('first item in ordered list', style='List Number') document.add_paragraph('second item in ordered list', style='List Number') #添加圖片 document.add_picture('monty-truth.png', width=Inches(1.25)) records = ( (3, '101', 'Spam'), (7, '422', 'Eggs'), (4, '631', 'Spam, spam, eggs, and spam') ) #添加表格:一行三列 # 表格樣式參數(shù)可選: # Normal Table # Table Grid # Light Shading、 Light Shading Accent 1 至 Light Shading Accent 6 # Light List、Light List Accent 1 至 Light List Accent 6 # Light Grid、Light Grid Accent 1 至 Light Grid Accent 6 # 太多了其它省略... table = document.add_table(rows=1, cols=3, style='Light Shading Accent 2') #獲取第一行的單元格列表 hdr_cells = table.rows[0].cells #下面三行設(shè)置上面第一行的三個單元格的文本值 hdr_cells[0].text = 'Qty' hdr_cells[1].text = 'Id' hdr_cells[2].text = 'Desc' for qty, id, desc in records: #表格添加行,并返回行所在的單元格列表 row_cells = table.add_row().cells row_cells[0].text = str(qty) row_cells[1].text = id row_cells[2].text = desc document.add_page_break() #保存.docx文檔 document.save('demo.docx')
創(chuàng)建的demo.docx內(nèi)容如下:
三、讀取word文檔
from docx import Document doc = Document('demo.docx') #每一段的內(nèi)容 for para in doc.paragraphs: print(para.text) #每一段的編號、內(nèi)容 for i in range(len(doc.paragraphs)): print(str(i), doc.paragraphs[i].text) #表格 tbs = doc.tables for tb in tbs: #行 for row in tb.rows: #列 for cell in row.cells: print(cell.text) #也可以用下面方法 '''text = '' for p in cell.paragraphs: text += p.text print(text)'''
運行結(jié)果:
Document Title A plain paragraph having some bold and some italic. Heading, level 1 Intense quote first item in unordered list second item in unordered list first item in ordered list second item in ordered list Document Title A plain paragraph having some bold and some italic. Heading, level 1 Intense quote first item in unordered list second item in unordered list first item in ordered list second item in ordered list Qty Id Desc 101 Spam 422 Eggs 631 Spam, spam, eggs, and spam [Finished in 0.2s]
以上就是本文的全部內(nèi)容,希望對大家的學習有所幫助,也希望大家多多支持腳本之家。
相關(guān)文章
Python初學者必須掌握的25個內(nèi)置函數(shù)詳解
這篇文章主要介紹了Python25個常用內(nèi)置函數(shù)總結(jié),本文羅列了數(shù)學相關(guān) 、功能相關(guān)、類型轉(zhuǎn)換、字符串處理、序列處理函數(shù)等常用內(nèi)置函數(shù),需要的朋友可以參考下2021-09-09python中sort()和sorted()的區(qū)別及用法實例
我們通常會遇到對數(shù)據(jù)庫中的數(shù)據(jù)進行排序的問題,下面這篇文章主要給大家介紹了關(guān)于python中sort()和sorted()的區(qū)別及用法的相關(guān)資料,文中通過實例代碼介紹的非常詳細,需要的朋友可以參考下2022-06-06講解Python3中NumPy數(shù)組尋找特定元素下標的兩種方法
這篇文章主要介紹了講解Python3中NumPy數(shù)組尋找特定元素下標的兩種方法,文中通過示例代碼介紹的非常詳細,對大家的學習或者工作具有一定的參考學習價值,需要的朋友們下面隨著小編來一起學習學習吧2019-08-08解決Python paramiko 模塊遠程執(zhí)行ssh 命令 nohup 不生效的問題
這篇文章主要介紹了解決Python paramiko 模塊遠程執(zhí)行ssh 命令 nohup 不生效的問題,本文給大家介紹的非常詳細,對大家的學習或工作具有一定的參考借鑒價值,需要的朋友可以參考下2020-07-07Pythony運維入門之Socket網(wǎng)絡(luò)編程詳解
這篇文章主要介紹了Pythony運維入門之Socket網(wǎng)絡(luò)編程,文中通過示例代碼介紹的非常詳細,對大家的學習或者工作具有一定的參考學習價值,需要的朋友們下面隨著小編來一起學習學習吧2019-04-04Python paramiko 模塊淺談與SSH主要功能模擬解析
這篇文章主要介紹了Python paramiko 模塊詳解與SSH主要功能模擬,本文通過圖文并茂的形式給大家介紹的非常詳細,具有一定的參考借鑒價值,需要的朋友可以參考下2020-02-02基于PyQt5實現(xiàn)圖轉(zhuǎn)文功能(示例代碼)
PyQt提供了一個設(shè)計良好的窗口控件集合,具有更方便的操作性。學過VB的同學會知道,相比與VB的使用,在界面設(shè)計上元素更豐富,這篇文章主要介紹了基于PyQt5完成的圖轉(zhuǎn)文功能,需要的朋友可以參考下2022-06-06