Python實現(xiàn)將Word表格嵌入到Excel中
今日需求
其實就是把Word中的表格轉(zhuǎn)到Excel中,順便做一個調(diào)整。這個需求在實際工作中,很多人還是經(jīng)常碰到的!
如果單單是兩個表格,那只要簡單的復制黏貼即可,但如果上百了呢?那就得考慮自動化了。好在今天碰到的需求中的原文件格式是比較有規(guī)律的,那直接來嘗試一下。
# 首先要pip install python-docx # 如果原文件是doc格式,那就先轉(zhuǎn)成docx from docx import Document import pandas as pd path = "./word表格轉(zhuǎn)excel.docx" docx = Document(path) table_s = docx.tables # 返回一個Table對象的列表 len(table_s) --> 2 # 返回值是2,因為原文件中只有兩個表格 list_ = [] # 初始化一個空列表,用來裝后面的dict_ for table in table_s: # 循環(huán)所有的表格列表 dict_ = {} dict_['名稱'] = table.cell(0, 1).text # 表格的索引是從(0行,0列)開始 dict_['身份'] = table.cell(0, 3).text dict_['簡介'] = table.cell(1, 1).text for i in range(3, len(table.rows)): # 后續(xù)的內(nèi)容格式不固定,所以循環(huán)獲取 dict_[table.cell(i, 0).text] = table.cell(i, 1).text list_.append(dict_)
當完成上述操作后,list_就會是一個字典列表。
接下來,將列表轉(zhuǎn)為DataFrame進行操作即可。
df = pd.DataFrame(list_) # 先將前三列作為索引,然后逆透視其他列,其實這就是個一維表轉(zhuǎn)二維表的過程 df = df.set_index(['名稱', '身份', '簡介']).stack(level=0).to_frame() # 重新設(shè)置一下行列索引的名字 df.index.names = ['名稱', '身份', '簡介', '物質(zhì)'] df.columns = ['現(xiàn)狀']
此時的df就跟需求結(jié)果相差不大了。
最后將DataFrame導出,稍作美化即可完成需求。
# 導出的時候一定要設(shè)置index=True不然只會保留一列Series df.to_excel("data3.xlsx", index=True, merge_cells=True)
完整代碼?
# 首先要pip install python-docx # 如果原文件是doc格式,那就先轉(zhuǎn)成docx from docx import Document import pandas as pd path = "./word表格轉(zhuǎn)excel.docx" docx = Document(path) table_s = docx.tables # 返回一個Table對象的列表 list_ = [] # 初始化一個空列表,用來裝后面的dict_ for table in table_s: # 循環(huán)所有的表格列表 dict_ = {} dict_['名稱'] = table.cell(0, 1).text # 表格的索引是從(0行,0列)開始的 dict_['身份'] = table.cell(0, 3).text dict_['簡介'] = table.cell(1, 1).text for i in range(3, len(table.rows)): # 循環(huán)獲得后面的內(nèi)容 dict_[table.cell(i, 0).text] = table.cell(i, 1).text list_.append(dict_) df = pd.DataFrame(list_) # 先將前三列作為索引,然后逆透視其他列,就是個一維表轉(zhuǎn)二維表的過程 df = df.set_index(['名稱', '身份', '簡介']).stack(level=0).to_frame() # 重新設(shè)置一下行列索引的名字 df.index.names = ['名稱', '身份', '簡介', '物質(zhì)'] df.columns = ['現(xiàn)狀'] # 導出的時候一定要設(shè)置index=True不然只會保留一列Series df.to_excel("data3.xlsx", index=True, merge_cells=True)
到此這篇關(guān)于Python實現(xiàn)將Word表格嵌入到Excel中的文章就介紹到這了,更多相關(guān)Python Word表格嵌入Excel內(nèi)容請搜索腳本之家以前的文章或繼續(xù)瀏覽下面的相關(guān)文章希望大家以后多多支持腳本之家!
相關(guān)文章
Python中實現(xiàn)參數(shù)類型檢查的簡單方法
這篇文章主要介紹了Python中實現(xiàn)參數(shù)類型檢查的簡單方法,本文講解使用裝飾器實現(xiàn)參數(shù)類型檢查并給出代碼實例,需要的朋友可以參考下2015-04-04Python通過調(diào)用mysql存儲過程實現(xiàn)更新數(shù)據(jù)功能示例
這篇文章主要介紹了Python通過調(diào)用mysql存儲過程實現(xiàn)更新數(shù)據(jù)功能,結(jié)合實例形式分析了Python調(diào)用mysql存儲過程實現(xiàn)更新數(shù)據(jù)的具體步驟與相關(guān)操作技巧,需要的朋友可以參考下2018-04-04詳解OpenCV中直方圖,掩膜和直方圖均衡化的實現(xiàn)
這篇文章主要為大家詳細介紹了OpenCV中直方圖、掩膜、直方圖均衡化詳細介紹及代碼的實現(xiàn),文中的示例代碼講解詳細,需要的可以參考一下2022-11-11Python實現(xiàn)計算長方形面積(帶參數(shù)函數(shù)demo)
今天小編就為大家分享一篇Python實現(xiàn)計算長方形面積(帶參數(shù)函數(shù)demo),具有很好的參考價值,希望對大家有所幫助。一起跟隨小編過來看看吧2020-01-01