欧美bbbwbbbw肥妇,免费乱码人妻系列日韩,一级黄片

Python word文本自動(dòng)化操作實(shí)現(xiàn)方法解析

 更新時(shí)間:2020年11月05日 09:17:28   作者:zeroing1  
這篇文章主要介紹了Python word文本自動(dòng)化操作實(shí)現(xiàn)方法解析,文中通過示例代碼介紹的非常詳細(xì),對(duì)大家的學(xué)習(xí)或者工作具有一定的參考學(xué)習(xí)價(jià)值,需要的朋友可以參考下

之前介紹了一個(gè)Python包 openpyxl ,用于處理 Excel ;而對(duì)于 Word 文本時(shí)同樣也有對(duì)應(yīng)的 Python庫(kù) Python-docx,在日常辦公中,如果需要處理多個(gè) word 文本,且操作步驟都是重復(fù)單調(diào)的,我想這個(gè)庫(kù)就可以幫到你

在了解 Python-docx 常用函數(shù)之前,需要知道 在 Python-docx 各命令所對(duì)應(yīng) word 各部件,下圖所示,

  • Document 指的是 word 文檔;
  • paragraph 對(duì)應(yīng)段落;
  • run 對(duì)應(yīng) 一句話中的各個(gè)字段,樣式調(diào)整時(shí),一般面向的操作對(duì)象都是逐字段進(jìn)行;

1,安裝 Python-docx

通過 pip 工具即可進(jìn)行安裝,在命令行中輸入 pip install Python-docx 即可

2,創(chuàng)建或打開 Document

Python-docx 導(dǎo)入包時(shí)是以 docx 命令存在的,與 Opencv 的 Python 版本導(dǎo)入方法相似;創(chuàng)建文件、打開文件以 Document() 命令操作,這里操作時(shí)需要注意幾個(gè)點(diǎn):

1,Document() 命令是基于默認(rèn)”模板“創(chuàng)建一個(gè)空白文檔,隨后可對(duì)文檔進(jìn)行編輯操作,最后沒有用 save() 函數(shù)存儲(chǔ)的話,文檔將伴隨程序結(jié)束同內(nèi)存一起

2,Document(path) 命令表示打開一個(gè)本地已經(jīng)存在的 docx 文件,path 表示存放目錄若不存在則程序報(bào)錯(cuò);
下面代碼中,創(chuàng)建了一個(gè)空白 docx,賦值給 document

from docx import Document

document = Document()

3,加入一段落

段落作為 docx 文檔正文的主要成分,那怎樣在創(chuàng)建好的 Document 中加入一段話呢?官方給出了兩種方式

1,在文檔后面插入

這種方法是比較常見且簡(jiǎn)單的,命令如下

paragraph = document.add_paragraph('Lorem ipsum dolor sit amet.')

方法中將創(chuàng)建好的段落引用指向 paragraph ,表明了光標(biāo)的位置,后面的一些操作可以借助 paragraph 引用變量來作為定位操作

2,在指定地方的前面插入

文檔編輯正常順序是在末尾進(jìn)行編輯,但有時(shí)在編輯時(shí)可能失誤少輸入一段話或文字,這時(shí)就用到 在指定位置前面 進(jìn)行插入操作

prior_paragraph = paragraph.insert_paragraph_before('Lorem ipsum')

此命令常用于 修正文檔 ,當(dāng)需要在一段話前面添加一些別的文字時(shí)。

4,標(biāo)題

docx 中 會(huì)用一、二、三級(jí)標(biāo)題將正文分為幾部分,讓文本主次感更強(qiáng);Python-docx 有對(duì)應(yīng)的內(nèi)置函數(shù)供我們使用,內(nèi)置函數(shù)中標(biāo)題分為主標(biāo)題和子標(biāo)題

創(chuàng)建標(biāo)題的函數(shù)方法中,有一個(gè)參數(shù) level 可進(jìn)行修改,若不設(shè)定時(shí)默認(rèn)為 主標(biāo)題(leve = 0);

document.add_heading('The REAL meaning of the universe')

子標(biāo)題分為 1-9 九個(gè)等級(jí),修改參數(shù) level 即可

document.add_heading('The role of dolphins', level=2)

5,分頁符

在 Word 中進(jìn)行文本編輯,想在單獨(dú)的一個(gè)新頁面編寫文本時(shí),就需要加入一個(gè) 強(qiáng)制分頁符,命令如下

document.add_page_break()

這里需要注意下,加入分頁符之后,新頁面上編輯的段落樣式屬性與之前頁面段落屬性是分隔開的

6,表格

在文檔中創(chuàng)建一個(gè) 2*2 的 表格

table = document.add_table(rows=2, cols=2)

表格中每個(gè)單元格可進(jìn)行文本編輯,顏色填充;對(duì)于特定表格而言可通過 row、column 索引來進(jìn)行定位,這里借助了操作 Excel 表格的思想

cell = table.cell(0, 1)

賦值其文本內(nèi)容

cell.text = 'parrot, possibly dead'

對(duì)一個(gè)一個(gè)單元格修改操作太麻煩了,可以一次選中指定列,對(duì)其單元格數(shù)據(jù)進(jìn)行逐個(gè)修改

row = table.rows[1]
row.cells[0].text = 'Foo bar to you.'
row.cells[1].text = 'And a hearty foo bar to you too sir!'

table.rows[index] 返回索引為 index 的指定行,根據(jù) .rows和.cols 表示 表格的全部行或列是可迭代的,因此可通過 for 循環(huán)來訪問每一個(gè)單元格

for row in table.rows:
for cell in row.cells:
print(cell.text)

因?yàn)?.rows 和 .cols 是可迭代的,通過 len() 命令來獲取行、列數(shù)

row_count = len(table.rows)
col_count = len(table.columns)

除了以上操作之外,還可以向 table 中逐漸添加行、列命令

row = table.add_row()
col = table.add_col()

上面提到了 創(chuàng)建表格,單元格修改,創(chuàng)建新行/列,逐行/列迭代,下面用個(gè)實(shí)例做個(gè)簡(jiǎn)單總結(jié),代碼中完成功能如下:

  • 1,item 創(chuàng)建一個(gè) 3*3 的元組數(shù)據(jù);
  • 2,在 word 中新建一個(gè) table,一行三列;
  • 3,創(chuàng)建好的 table 的表頭依次設(shè)置為 Qty,SKU,Description;
  • 4,將 item 中的元素,以 table 逐行 3 個(gè)的方式創(chuàng)建;
# get table data -------------
items = (
  (7, '1024', 'Plush kittens'),
  (3, '2042', 'Furbees'),
  (1, '1288', 'French Poodle Collars, Deluxe'),
)

# add table ------------------
table = document.add_table(1, 3)

# populate header row --------
heading_cells = table.rows[0].cells
heading_cells[0].text = 'Qty'
heading_cells[1].text = 'SKU'
heading_cells[2].text = 'Description'

# add a data row for each item
for item in items:
  cells = table.add_row().cells
  cells[0].text = str(item.qty)
  cells[1].text = item.sku
  cells[2].text = item.desc

此外,還可修改 表格的樣式,word 文檔中的表格樣式這里都可以設(shè)定(樣式名稱可以通過word 文檔自有的樣式,將鼠標(biāo)放到樣式的縮略圖上即可查看),但需要注意的是,使用樣式時(shí)需要去掉word軟件中樣式名字中的空格,例如下面 Office 原樣式名字為 Light Shading-Accent1,這里直接把中間空格去掉

table.style = 'LightShading-Accent1'

7,圖片

在 python-docx 中添加圖片用下面命令即可完成

document.add_picture('image-filename.png')

上面加入的是本地文件 path ,除此之外還可以使用 file-like object,這種格式對(duì)于數(shù)據(jù)庫(kù)或者網(wǎng)絡(luò)上的圖片讀取時(shí)時(shí)非常方便的

修改圖片大小

python-docx 加入圖像默認(rèn)表示的是 native size,正常圖片加入時(shí)會(huì)出現(xiàn)相同圖片的一側(cè)出現(xiàn) 4.167 inches 的空白處,大概占比紙張寬度的一半;在獲取想要圖像大小時(shí),可以指定寬度或高度設(shè)為較為方便的單位

from docx.shared import Inches

document.add_picture('image-filename.png', width=Inches(1.0))

8, 應(yīng)用段落樣式

設(shè)定段落樣式方法有兩種,一種創(chuàng)建時(shí)就可以設(shè)置

document.add_paragraph('Lorem ipsum dolor sit amet.', style='ListBullet')

另一種是創(chuàng)建完之后再再進(jìn)行設(shè)置(這時(shí)不需要去掉樣式名稱中的空格)

paragraph = document.add_paragraph('Lorem ipsum dolor sit amet.')
paragraph.style = 'List Bullet'

9,字體加黑并斜體化

對(duì)字體做斜體和加黑操作之前, 需要理解在一個(gè)段落中都做了什么事情,簡(jiǎn)單來說兩部分:

1,一個(gè)段落具有全部 block-level formatting ,比如制表符、行高、tabs 等;

2,Character-level formatting ,例如粗體、斜體,應(yīng)用的是 run對(duì)象,在段落中的所有內(nèi)容必須是一個(gè) run ,且不僅包含一個(gè),
Run 對(duì)象同時(shí)包含一個(gè) .bold 和.italic 屬性,可讓你來對(duì)其值進(jìn)行設(shè)置

paragraph = document.add_paragraph('Lorem ipsum ')
run = paragraph.add_run('dolor')
run.bold = True
paragraph.add_run(' sit amet.')

上面代碼中最后創(chuàng)建的文本格式形如:Lorem ipsum dolor sit amet.

需要注意的是設(shè)置 bold 或 italic 時(shí),可以把 .add_run() 命令直接放在右邊

paragraph.add_run('dolor').bold = True

# is equivalent to:

run = paragraph.add_run('dolor')
run.bold = True

# except you don't have a reference to `run` afterward

10,字符樣式

除了上面加黑、斜體之外、還可定義字符樣式( character styles ), 定義時(shí)加入一行新的 run 對(duì)象;例如

paragraph = document.add_paragraph('Normal text, ')
paragraph.add_run('text with emphasis.', 'Emphasis')

上面創(chuàng)建一個(gè)文本 ,結(jié)果如下

Normal text,text with emphasis. ;text with emphasis. 部分應(yīng)用 Emphasis(強(qiáng)調(diào)) 的字符格式

上面代碼也可改為;

paragraph = document.add_paragraph('Normal text, ')
run = paragraph.add_run('text with emphasis.')
run.style = 'Emphasis'

與段落樣式一樣,樣式名字與 Word UI 里的一樣,在 Word 樣式管理器中都能找得到!

以上就是本文的全部?jī)?nèi)容,希望對(duì)大家的學(xué)習(xí)有所幫助,也希望大家多多支持腳本之家。

相關(guān)文章

  • 詳解Pycharm安裝及Django安裝配置指南

    詳解Pycharm安裝及Django安裝配置指南

    這篇文章主要介紹了Pycharm安裝及Django安裝配置指南,本文通過實(shí)例代碼給大家介紹的非常詳細(xì),對(duì)大家的學(xué)習(xí)或工作具有一定的參考借鑒價(jià)值,需要的朋友可以參考下
    2020-09-09
  • python中利用zfill方法自動(dòng)給數(shù)字前面補(bǔ)0

    python中利用zfill方法自動(dòng)給數(shù)字前面補(bǔ)0

    python中有一個(gè)zfill方法用來給字符串前面補(bǔ)0,非常不錯(cuò),下面小編給大家分享了實(shí)例代碼,非常不錯(cuò),具有參考借鑒價(jià)值,需要的朋友參考下吧
    2018-04-04
  • Python?hashlib模塊與subprocess模塊使用詳細(xì)介紹

    Python?hashlib模塊與subprocess模塊使用詳細(xì)介紹

    這篇文章主要介紹了Python?hashlib模塊與subprocess模塊使用,文中通過示例代碼介紹的非常詳細(xì),對(duì)大家的學(xué)習(xí)或者工作具有一定的參考學(xué)習(xí)價(jià)值,需要的朋友們下面隨著小編來一起學(xué)習(xí)吧
    2022-10-10
  • Python實(shí)現(xiàn)監(jiān)控遠(yuǎn)程主機(jī)實(shí)時(shí)數(shù)據(jù)的示例詳解

    Python實(shí)現(xiàn)監(jiān)控遠(yuǎn)程主機(jī)實(shí)時(shí)數(shù)據(jù)的示例詳解

    這篇文章主要為大家詳細(xì)介紹了Python如何使用Socket庫(kù)和相應(yīng)的第三方庫(kù)來監(jiān)控遠(yuǎn)程主機(jī)的實(shí)時(shí)數(shù)據(jù),比如CPU使用率、內(nèi)存使用率、網(wǎng)絡(luò)帶寬等,感興趣的可以了解一下
    2023-04-04
  • python中的 Matplotlib 繪制多子圖時(shí)的重疊問題及解決方案

    python中的 Matplotlib 繪制多子圖時(shí)的重疊問題及解決方案

    當(dāng)使用 Matplotlib 繪制多個(gè)子圖(subplots)時(shí),如果標(biāo)簽或標(biāo)題文字交叉或重疊,遇到這樣的問題如何處理呢,下面小編給大家介紹了python中的 Matplotlib 繪制多子圖時(shí)的重疊問題及解決方案,需要的朋友可以參考下
    2024-06-06
  • 淺談一下python線程池簡(jiǎn)單應(yīng)用

    淺談一下python線程池簡(jiǎn)單應(yīng)用

    這篇文章主要介紹了淺談一下python線程池簡(jiǎn)單應(yīng)用,線程池在系統(tǒng)啟動(dòng)時(shí)即創(chuàng)建大量空閑的線程,程序只要將一個(gè)函數(shù)提交給線程池,線程池就會(huì)啟動(dòng)一個(gè)空閑的線程來執(zhí)行它,需要的朋友可以參考下
    2023-04-04
  • scikit-learn處理缺失數(shù)據(jù)的方法與實(shí)踐

    scikit-learn處理缺失數(shù)據(jù)的方法與實(shí)踐

    scikit-learn作為Python中廣泛使用的機(jī)器學(xué)習(xí)庫(kù),提供了多種工具和技術(shù)來幫助我們處理缺失數(shù)據(jù),本文將詳細(xì)介紹sklearn處理缺失數(shù)據(jù)的方法,并提供實(shí)際的代碼示例,需要的朋友可以參考下
    2024-06-06
  • OpenCV半小時(shí)掌握基本操作之對(duì)象測(cè)量

    OpenCV半小時(shí)掌握基本操作之對(duì)象測(cè)量

    這篇文章主要介紹了OpenCV基本操作之對(duì)象測(cè)量,本文給大家介紹的非常詳細(xì),對(duì)大家的學(xué)習(xí)或工作具有一定的參考借鑒價(jià)值,需要的朋友可以參考下
    2021-09-09
  • Python虛擬環(huán)境創(chuàng)建和使用方法(使用自帶的venv模塊)

    Python虛擬環(huán)境創(chuàng)建和使用方法(使用自帶的venv模塊)

    這篇文章主要如何在Python中使用虛擬環(huán)境,包括創(chuàng)建、激活、使用、生成requirements.txt文件、卸載包和刪除虛擬環(huán)境,虛擬環(huán)境有助于隔離項(xiàng)目依賴,避免版本沖突,并便于部署,需要的朋友可以參考下
    2024-12-12
  • Python yield 小結(jié)和實(shí)例

    Python yield 小結(jié)和實(shí)例

    yield的作用就是把一個(gè)函數(shù)變成一個(gè) generator,帶有 yield 的函數(shù)不再是一個(gè)普通函數(shù),Python 解釋器會(huì)將其視為一個(gè) generator(不知道什么是generator要先去理解一下Python的generator的了)
    2014-04-04

最新評(píng)論