使用Python解析FineReport模板數(shù)據(jù)集
背景
在使用 FineReport 作為報(bào)表平臺過程中,
當(dāng)報(bào)表項(xiàng)目過多,或者報(bào)表項(xiàng)目需要遷移,又或者報(bào)表數(shù)據(jù)源需要遷移時(shí),
我們通常需要知道報(bào)表用到的表有哪些,或者需要修改的SQL語句有哪些。
這時(shí)我們在 FineReport 設(shè)計(jì)器中需要將模板的數(shù)據(jù)集提取出來。
但目前設(shè)計(jì)器中沒有 數(shù)據(jù)集導(dǎo)出 的功能。
所以我們使用Python 開發(fā)程式以解析報(bào)表模板文件獲取 數(shù)據(jù)集 和 SQL語句,并保存為Excel,
以提供給后續(xù)解析SQL獲取調(diào)用內(nèi)容的項(xiàng)目使用。
應(yīng)用場景
- 查找調(diào)用內(nèi)容
- FineReport 模板遷移
- 元數(shù)據(jù)
- 數(shù)據(jù)血緣
操作對象
本示例中使用 本地工作目錄 中的 報(bào)表模板,F(xiàn)ineReport 平臺版本為 11
本地工作目錄路徑
D:\FineReport_11\webapps\webroot\WEB-INF\reportlets
示例報(bào)表模板路徑
01_dev\record_monitor\record_scheduler.cpt
示例報(bào)表模板數(shù)據(jù)集名稱
log_record_execute
示例報(bào)表模板數(shù)據(jù)鏈接名稱
LogDB
示例報(bào)表模板截圖

解析過程
查找目標(biāo)模板文件
為保證數(shù)據(jù)和模板安全,請先下載 正式環(huán)境reports文件夾,在本地進(jìn)行匹配
工作過程中,平臺的報(bào)表目錄不一定之后報(bào)表模板文件,故需要用代碼先查找匹配,再打開;
代碼
import pathlib
# 請先下載 正式環(huán)境reports文件夾,在本地進(jìn)行匹配
work_directory = pathlib.Path("D:\\FineReport_11\\webapps\\webroot\\WEB-INF\\reportlets")
top = pathlib.Path("D:\\FineReport_11\\webapps\\webroot\\WEB-INF\\reportlets\\01_dev\\record_monitor")
# 遞歸獲取 工作目錄 本路徑和子路徑所有擴(kuò)展名為 .cpt 的 文件
for f in top.rglob("*.cpt"):
# 模板文件的絕對路徑
abs_path = f.absolute()
# 為保證對象準(zhǔn)確,使用絕對路徑
print(abs_path.__str__())
運(yùn)行結(jié)果
D:\FineReport_11\webapps\webroot\WEB-INF\reportlets\01_dev\record_monitor\record_scheduler.cpt
獲取 數(shù)據(jù)集
FineReport 報(bào)表模板 .cpt .frm 本身是 xml 文件,故可直接使用解析XML的方式解析;
解析方式是XPATH語法定位目標(biāo)元素
代碼
import pathlib
from lxml import etree
# 請先下載 正式環(huán)境reports文件夾,在本地進(jìn)行匹配
work_directory = pathlib.Path("D:\\FineReport_11\\webapps\\webroot\\WEB-INF\\reportlets")
top = pathlib.Path("D:\\FineReport_11\\webapps\\webroot\\WEB-INF\\reportlets\\01_dev\\record_monitor")
# 解析結(jié)果 收集
result_list = []
# 遞歸獲取 工作目錄 本路徑和子路徑所有擴(kuò)展名為 .cpt 的 文件
for f in top.rglob("*.cpt"):
# 模板文件的絕對路徑
abs_path = f.absolute()
with open(abs_path, mode="rb") as fr:
xslt_content = fr.read()
# 開始解析 模板文件 XML
xml_root = etree.XML(xslt_content)
# 使用 XPATH 定位 XML 中 數(shù)據(jù)集內(nèi)容
tabel_data_el = xml_root.xpath("http://*/TableDataMap//TableData[@class='com.fr.data.impl.DBTableData']")
for db_data in tabel_data_el:
# 數(shù)據(jù)集名稱
date_source_name = db_data.get("name")
print(date_source_name)
運(yùn)行結(jié)果
log_record_execute
我們可以用 Vs Code 或者其他文本編輯器從資源管理器打開這個(gè)模板文件,
可以看到 數(shù)據(jù)集 在模板XML中的樣子,
數(shù)據(jù)集都在 標(biāo)簽名為 TableDataMap 的 xml 元素下,
數(shù)據(jù)集本身就是 標(biāo)簽名為 TableData 的 xml 元素,所以使用 XPATH 能夠根據(jù)這種結(jié)構(gòu)定位到。
同時(shí)數(shù)據(jù)集的內(nèi)容也能以相同方式定位到。
部分 XML
<?xml version="1.0" encoding="UTF-8"?>
<WorkBook xmlVersion="20211223" releaseVersion="11.0.0">
<TableDataMap>
<TableData name="log_record_execute" class="com.fr.data.impl.DBTableData">
<Parameters>
<Parameter>
<Attributes name="start_date"/>
<O>
<![CDATA[2023-07-01 00:00:00]]></O>
</Parameter>
<Parameter>
<Attributes name="end_date"/>
<O>
<![CDATA[2023-09-07 00:00:00]]></O>
</Parameter>
</Parameters>
<Attributes maxMemRowCount="-1"/>
<Connection class="com.fr.data.impl.NameDatabaseConnection">
<DatabaseName>
<![CDATA[LogDB]]></DatabaseName>
</Connection>
<Query>
<![CDATA[select * from fine_record_execute where todate(time) >= '${start_date}' and todate(time) <= '${end_date}']]></Query>
<PageQuery>
<![CDATA[]]></PageQuery>
</TableData>
</TableDataMap>
...
</WorkBook>
獲取數(shù)據(jù)集下的內(nèi)容
獲取到數(shù)據(jù)集的XML之后,變不需要從整個(gè)模板文件定位了,因?yàn)閿?shù)據(jù)集的各種內(nèi)容都在這串XML里了,
所以直接解析 數(shù)據(jù)集XML 的 字符串就行;
代碼
import json
import pathlib
from lxml import etree
# 請先下載 正式環(huán)境reports文件夾,在本地進(jìn)行匹配
work_directory = pathlib.Path("D:\\FineReport_11\\webapps\\webroot\\WEB-INF\\reportlets")
top = pathlib.Path("D:\\FineReport_11\\webapps\\webroot\\WEB-INF\\reportlets\\01_dev\\record_monitor")
# 遞歸獲取 工作目錄 本路徑和子路徑所有擴(kuò)展名為 .cpt 的 文件
for f in top.rglob("*.cpt"):
# 模板文件的絕對路徑
abs_path = f.absolute()
with open(abs_path, mode="rb") as fr:
xslt_content = fr.read()
# 開始解析 模板文件 XML
xml_root = etree.XML(xslt_content)
# 使用 XPATH 定位 XML 中 數(shù)據(jù)集內(nèi)容
tabel_data_el = xml_root.xpath("http://*/TableDataMap//TableData[@class='com.fr.data.impl.DBTableData']")
for db_data in tabel_data_el:
# 數(shù)據(jù)集名稱
date_source_name = db_data.get("name")
# 轉(zhuǎn) string 取巧,重新定位數(shù)據(jù)集內(nèi)容
string = etree.tostring(db_data, encoding='utf-8').decode('utf-8')
data_source = etree.XML(string)
# 即使 XPATH 定位到的是單個(gè)對象,但是返回值是一個(gè)list,需要將 list 里的對象 重新拼成 string
conn = data_source.xpath("/TableData/Connection/DatabaseName/text()")
conn_collect = []
for j in conn:
# 數(shù)據(jù)鏈接名字
conn_collect.append(str(j).strip())
conn_string = "".join(conn_collect)
query = data_source.xpath("/TableData/Query/text()")
query_collect = []
for j in query:
# 數(shù)據(jù)集SQL
query_collect.append(str(j).strip())
query_string = "".join(query_collect)
# 將 解析結(jié)果 拼接到 dict
data_source_json = {
"report": pathlib.Path.relative_to(abs_path, work_directory).__str__(),
"data_source": date_source_name,
"conn": conn_string,
"query": query_string
}
print(json.dumps(data_source_json, ensure_ascii=False))
運(yùn)行結(jié)果
{
"report": "01_dev\\record_monitor\\record_scheduler.cpt",
"data_source": "log_record_execute",
"conn": "LogDB",
"query": "select * from fine_record_execute where todate(time) >= '${start_date}' and todate(time) <= '${end_date}'"
}
可以看到,報(bào)表模板路徑,數(shù)據(jù)集名稱,數(shù)據(jù)鏈接名稱,SQL語句都完整獲取到了。
完整代碼
最后將獲取到的內(nèi)容轉(zhuǎn)成 pandas 的 DataFrame,然后輸出到Excel
import pathlib
import pandas as pd
from lxml import etree
# 請先下載 正式環(huán)境reports文件夾,在本地進(jìn)行匹配
work_directory = pathlib.Path("D:\\FineReport_11\\webapps\\webroot\\WEB-INF\\reportlets")
top = pathlib.Path("D:\\FineReport_11\\webapps\\webroot\\WEB-INF\\reportlets\\01_dev\\record_monitor")
# 解析結(jié)果 收集
result_list = []
# fineReport .cpt .frm 本身是xml文件,故可直接按行匹配字符查找是否與對象有關(guān)
# 遞歸獲取 工作目錄 本路徑和子路徑所有擴(kuò)展名為 .cpt 的 文件
for f in top.rglob("*.cpt"):
# 模板文件的絕對路徑
abs_path = f.absolute()
with open(abs_path, mode="rb") as fr:
xslt_content = fr.read()
# 開始解析 模板文件 XML
xml_root = etree.XML(xslt_content)
# 使用 XPATH 定位 XML 中 數(shù)據(jù)集內(nèi)容
tabel_data_el = xml_root.xpath("http://*/TableDataMap//TableData[@class='com.fr.data.impl.DBTableData']")
for db_data in tabel_data_el:
# 數(shù)據(jù)集名稱
date_source_name = db_data.get("name")
# 轉(zhuǎn) string 取巧,重新定位數(shù)據(jù)集內(nèi)容
string = etree.tostring(db_data, encoding='utf-8').decode('utf-8')
data_source = etree.XML(string)
# 即使 XPATH 定位到的是單個(gè)對象,但是返回值是一個(gè)list,需要將 list 里的對象 重新拼成 string
conn = data_source.xpath("/TableData/Connection/DatabaseName/text()")
conn_collect = []
for j in conn:
# 數(shù)據(jù)鏈接名字
conn_collect.append(str(j).strip())
conn_string = "".join(conn_collect)
query = data_source.xpath("/TableData/Query/text()")
query_collect = []
for j in query:
# 數(shù)據(jù)集SQL
query_collect.append(str(j).strip())
query_string = "".join(query_collect)
# 將 解析結(jié)果 拼接到 dict
data_source_json = {
"report": pathlib.Path.relative_to(abs_path, work_directory).__str__(),
"data_source": date_source_name,
"conn": conn_string,
"query": query_string
}
result_list.append(data_source_json)
df = pd.DataFrame(result_list)
df.to_excel("./data_source.xlsx", engine="openpyxl", index=False)
運(yùn)行結(jié)果

到此這篇關(guān)于使用Python解析FineReport模板數(shù)據(jù)集的文章就介紹到這了,更多相關(guān)Python解析FineReport數(shù)據(jù)集內(nèi)容請搜索腳本之家以前的文章或繼續(xù)瀏覽下面的相關(guān)文章希望大家以后多多支持腳本之家!
相關(guān)文章
Python圖像處理庫PIL的ImageDraw模塊介紹詳解
這篇文章主要介紹了Python圖像處理庫PIL的ImageDraw模塊介紹詳解,文中通過示例代碼介紹的非常詳細(xì),對大家的學(xué)習(xí)或者工作具有一定的參考學(xué)習(xí)價(jià)值,需要的朋友們下面隨著小編來一起學(xué)習(xí)學(xué)習(xí)吧2020-02-02
詳解pycharm連接遠(yuǎn)程linux服務(wù)器的虛擬環(huán)境的方法
這篇文章主要介紹了pycharm連接遠(yuǎn)程linux服務(wù)器的虛擬環(huán)境的詳細(xì)教程,本文通過圖文并茂的形式給大家介紹的非常詳細(xì),對大家的學(xué)習(xí)或工作具有一定的參考借鑒價(jià)值,需要的朋友可以參考下2020-11-11
python讀寫刪除復(fù)制文件操作方法詳細(xì)實(shí)例總結(jié)
這篇文章主要介紹了python讀寫刪除復(fù)制文件操作方法詳細(xì)實(shí)例總結(jié),需要的朋友可以參考下2021-04-04
python實(shí)現(xiàn)與Oracle數(shù)據(jù)庫交互操作示例
這篇文章主要為大家介紹了python實(shí)現(xiàn)與Oracle數(shù)據(jù)庫交互操作示例,有需要的朋友可以借鑒參考下,希望能夠有所幫助,祝大家,多多進(jìn)步,早日升職加薪2021-10-10
Python使用pip安裝報(bào)錯(cuò):is not a supported wheel on this platform的解決
這篇文章主要介紹了Python使用pip安裝報(bào)錯(cuò):is not a supported wheel on this platform的解決方法,結(jié)合實(shí)例形式分析了在安裝版本正確的情況下pip安裝報(bào)錯(cuò)的原因與相應(yīng)的解決方法,需要的朋友可以參考下2018-01-01
Python 圖片文字識別的實(shí)現(xiàn)之PaddleOCR
OCR方向的工程師,之前一定聽說過PaddleOCR這個(gè)項(xiàng)目,其主要推薦的PP-OCR算法更是被國內(nèi)外企業(yè)開發(fā)者廣泛應(yīng)用,短短半年時(shí)間,累計(jì)Star數(shù)量已超過15k,頻頻登上Github Trending和Paperswithcode 日榜月榜第一2021-11-11

