欧美bbbwbbbw肥妇,免费乱码人妻系列日韩,一级黄片

python讀取json數(shù)據(jù)還原表格批量轉(zhuǎn)換成html

 更新時(shí)間:2022年03月04日 09:51:22   作者:kuokay  
這篇文章主要介紹了python讀取json數(shù)據(jù)還原表格批量轉(zhuǎn)換成html,由于需要對(duì)ocr識(shí)別系統(tǒng)的表格識(shí)別結(jié)果做驗(yàn)證,通過(guò)返回的json文件結(jié)果對(duì)比比較麻煩,故需要將json文件里面的識(shí)別結(jié)果還原為表格做驗(yàn)證,下面詳細(xì)內(nèi)容需要的小伙伴可以參考一下

背景:

由于需要對(duì)ocr識(shí)別系統(tǒng)的表格識(shí)別結(jié)果做驗(yàn)證,通過(guò)返回的json文件結(jié)果對(duì)比比較麻煩,故需要將json文件里面的識(shí)別結(jié)果還原為表格做驗(yàn)證。

文件部分內(nèi)容如下:

{"row":"6","col","5""start_row": 0, "start_column": 0, "end_row": 0, "end_column": 0, "data": "稱(chēng)", "position": [51, 71, 168, 93], "org_position": [50, 60, 167, 62, 166, 84, 49, 82], "char_position": [[86, 83, 100, 100]], "lines": [{"text": "稱(chēng)", "poly": [84, 73, 98, 73, 98, 90, 84, 90, 0.874], "score": 0.874, "char_centers": [[91, 82]], "char_polygons": [[84, 77, 98, 74, 98, 87, 84, 90]], "char_candidates": [["稱(chēng)"]], "char_candidates_score": [[0.999]], "char_scores": [0.999]}]}

現(xiàn)在需要通過(guò)行列的起始和結(jié)束坐標(biāo)以及內(nèi)容生成相應(yīng)的表格

開(kāi)始準(zhǔn)備使用js但由于一些語(yǔ)法忘記,所以還是選用python進(jìn)行。
在經(jīng)過(guò)一些列研究后發(fā)現(xiàn)利用python-docx可自動(dòng)生成表格,但是格式是word的,所有后期又進(jìn)行了word轉(zhuǎn)html操作。

一、實(shí)操

pip install python_docx

1.首先創(chuàng)建一個(gè)新的文檔

from docx import Document
document = Document()

然后用Document類(lèi)的add_table方法增加一個(gè)表格,其中rows是行,cols是列,style表格樣式,具體可以查看官方文檔:

table = document.add_table(rows=37,cols=13,style='Table Grid')

上述代碼就在word里插入了一個(gè)37行、13列的表格。(有37*13=481個(gè)cell)

生成的每個(gè)cell都是有“坐標(biāo)”的,比如上面的表格左上角cell為(0,0),右下角cell為(36,12)

下面要做的就是合并一些cell,從而達(dá)到我們最終需要的表格

table.cell(0,0).merge(table.cell(2,2))

上述代碼就將cell(0,0)到cell(2,2)之間的所有cell合并成一個(gè)cell

這里需要注意的是,雖然每個(gè)cell都合并了,但其實(shí)它還是存在的。比如合并了(0,0)和(0,1)兩個(gè)cell,那么這個(gè)合并的cell其實(shí)就是(0,0;0,1)

如果cell較多,無(wú)法直觀的看出坐標(biāo)的話(huà),可以用下列的代碼將每個(gè)cell的坐標(biāo)都標(biāo)注出來(lái),方便合并

document = Document()
table = document.add_table(rows=37,cols=13,style='Table Grid')

document.save('table-1.docx')

document1 = Document('table-1.docx')
table = document1.tables[0]
for row,obj_row in enumerate(table.rows):
? ?for col,cell in enumerate(obj_row.cells):
? ? ? ?cell.text = cell.text + "%d,%d " % (row,col)

document1.save('table-2.docx')

2.添加文本

將所有cell依次合并后,就需要向合并后的cell里添加文本。

用table的row方法可以得到一個(gè)表格的一行l(wèi)ist其中包含了這一行的所有cell

hdr_cells0 = table.rows[0].cells

上面代碼就得到了合并表格后的第一行所有cell,然后我們用hdr_cell0[0]就可以得到合并表格后的第一行的第一個(gè)cell。用add_paragraph方法即可像cell里添加文本

hdr_cells0[0].add_paragraph('數(shù)據(jù)文字')

其他使用方法可參考官網(wǎng)模塊:https://www.osgeo.cn/python-docx/

二、word轉(zhuǎn)成html

1.使用pydocx轉(zhuǎn)換

pip install pydocx

from pydocx import PyDocX
html = PyDocX.to_html("test.docx")
f = open("test.html", 'w', encoding="utf-8")
f.write(html)
f.close()

通過(guò)網(wǎng)頁(yè)上傳word文檔,只接收docx

<form method="post" enctype="multipart/form-data">
<input type="file" name="file" accept="application/vnd.openxmlformats-officedocument.wordprocessingml.document">
</form>

2.使用win32模塊

pip3 install pypiwin32

from win32com import client as wc
import os

word = wc.Dispatch('Word.Application')


def wordsToHtml(dir):
? ? for path, subdirs, files in os.walk(dir):
? ? ? ? for wordFile in files:
? ? ? ? ? ? wordFullName = os.path.join(path, wordFile)
? ? ? ? ? ? doc = word.Documents.Open(wordFullName)

? ? ? ? ? ? wordFile2 = wordFile
? ? ? ? ? ? dotIndex = wordFile2.rfind(".")
? ? ? ? ? ? if (dotIndex == -1):
? ? ? ? ? ? ? ? print(wordFullName + "********************ERROR: 未取得后綴名!")

? ? ? ? ? ? fileSuffix = wordFile2[(dotIndex + 1):]
? ? ? ? ? ? if (fileSuffix == "doc" or fileSuffix == "docx"):
? ? ? ? ? ? ? ? fileName = wordFile2[: dotIndex]
? ? ? ? ? ? ? ? htmlName = fileName + ".html"
? ? ? ? ? ? ? ? htmlFullName = os.path.join(path, htmlName)
? ? ? ? ? ? ? ? print("generate html:" + htmlFullName)
? ? ? ? ? ? ? ? doc.SaveAs(htmlFullName, 10)
? ? ? ? ? ? ? ? doc.Close()

? ? word.Quit()
? ? print("")
? ? print("Finished!")


if __name__ == '__main__':
? ? import sys

? ? if len(sys.argv) != 2:
? ? ? ? print("Usage: python funcName.py rootdir")
? ? ? ? sys.exit(100)
? ? wordsToHtml(sys.argv[1])

到此這篇關(guān)于python讀取json數(shù)據(jù)還原表格批量轉(zhuǎn)換成html的文章就介紹到這了,更多相關(guān)python讀取json數(shù)據(jù)內(nèi)容請(qǐng)搜索腳本之家以前的文章或繼續(xù)瀏覽下面的相關(guān)文章希望大家以后多多支持腳本之家!

相關(guān)文章

  • 在Mac中PyCharm配置python Anaconda環(huán)境過(guò)程圖解

    在Mac中PyCharm配置python Anaconda環(huán)境過(guò)程圖解

    這篇文章主要介紹了在Mac中PyCharm配置python Anaconda環(huán)境過(guò)程圖解,文中通過(guò)示例代碼介紹的非常詳細(xì),對(duì)大家的學(xué)習(xí)或者工作具有一定的參考學(xué)習(xí)價(jià)值,需要的朋友可以參考下
    2020-03-03
  • python進(jìn)程池的簡(jiǎn)單實(shí)現(xiàn)

    python進(jìn)程池的簡(jiǎn)單實(shí)現(xiàn)

    本文主要介紹了python進(jìn)程池的簡(jiǎn)單實(shí)現(xiàn),文中通過(guò)示例代碼介紹的非常詳細(xì),對(duì)大家的學(xué)習(xí)或者工作具有一定的參考學(xué)習(xí)價(jià)值,需要的朋友們下面隨著小編來(lái)一起學(xué)習(xí)學(xué)習(xí)吧
    2023-03-03
  • 詳解python之簡(jiǎn)單主機(jī)批量管理工具

    詳解python之簡(jiǎn)單主機(jī)批量管理工具

    這篇文章主要介紹了詳解python之簡(jiǎn)單主機(jī)批量管理工具,具有一定的參考價(jià)值,有興趣的可以了解一下。
    2017-01-01
  • 使用Streamlit和Pandas實(shí)現(xiàn)帶有可點(diǎn)擊鏈接的數(shù)據(jù)表格

    使用Streamlit和Pandas實(shí)現(xiàn)帶有可點(diǎn)擊鏈接的數(shù)據(jù)表格

    這篇文章主要為大家詳細(xì)介紹了如何利用?Streamlit?和?Pandas?在?Python?中創(chuàng)建一個(gè)帶有可點(diǎn)擊鏈接的數(shù)據(jù)表格,感興趣的小伙伴可以跟隨小編一起學(xué)習(xí)一下
    2023-11-11
  • python函數(shù)的萬(wàn)能參數(shù)傳參詳解

    python函數(shù)的萬(wàn)能參數(shù)傳參詳解

    這篇文章主要介紹了python函數(shù)的萬(wàn)能參數(shù)傳參詳解,文中通過(guò)示例代碼介紹的非常詳細(xì),對(duì)大家的學(xué)習(xí)或者工作具有一定的參考學(xué)習(xí)價(jià)值,需要的朋友可以參考下
    2019-07-07
  • 關(guān)于Python 3中print函數(shù)的換行詳解

    關(guān)于Python 3中print函數(shù)的換行詳解

    最近在學(xué)習(xí)python3,發(fā)現(xiàn)了一個(gè)問(wèn)題想著總結(jié)出來(lái),所以下面這篇文章主要給大家介紹了關(guān)于Python 3中print函數(shù)換行的相關(guān)資料,文中通過(guò)示例代碼介紹的非常詳細(xì),對(duì)需要的朋友們具有一定的參考學(xué)習(xí)價(jià)值,感興趣的朋友們下面隨著小編來(lái)一起學(xué)習(xí)學(xué)習(xí)吧。
    2017-08-08
  • PyQt5頁(yè)面跳轉(zhuǎn)問(wèn)題及解決方式

    PyQt5頁(yè)面跳轉(zhuǎn)問(wèn)題及解決方式

    本文主要介紹了PyQt5頁(yè)面跳轉(zhuǎn)問(wèn)題及解決方式,文中通過(guò)示例代碼介紹的非常詳細(xì),對(duì)大家的學(xué)習(xí)或者工作具有一定的參考學(xué)習(xí)價(jià)值,需要的朋友們下面隨著小編來(lái)一起學(xué)習(xí)學(xué)習(xí)吧
    2023-01-01
  • Python曲線(xiàn)擬合詳解

    Python曲線(xiàn)擬合詳解

    這篇文章主要介紹了關(guān)于python曲線(xiàn)擬合,scipy.optimize中,curve_fit函數(shù)可調(diào)用非線(xiàn)性最小二乘法進(jìn)行函數(shù)擬合,文中有詳細(xì)的代碼作為參考,需要的朋友可以閱讀參考
    2023-04-04
  • Python測(cè)試框架pytest核心庫(kù)pluggy詳解

    Python測(cè)試框架pytest核心庫(kù)pluggy詳解

    這篇文章主要為大家介紹了Python測(cè)試框架pytest核心庫(kù)pluggy使用示例詳解,有需要的朋友可以借鑒參考下,希望能夠有所幫助,祝大家多多進(jìn)步,早日升職加薪
    2022-08-08
  • Python 圖形界面框架TkInter之在源碼中找pack方法

    Python 圖形界面框架TkInter之在源碼中找pack方法

    這篇文章主要介紹了Python 圖形界面框架TkInter之在源碼中找pack方法,根據(jù)不同的需求,選擇對(duì)應(yīng)的布局方式,每個(gè)控件都可以使用pack作為布局管理,下面我們就來(lái)看看從源碼中找pack()在哪里,需要的朋友可以參考下
    2022-03-03

最新評(píng)論