python解析基于xml格式的日志文件
大家中午好,由于過年一直還沒回到狀態(tài),好久沒分享一波小知識(shí)了,今天,繼續(xù)給大家分享一波Python解析日志的小腳本。
首先,同樣的先看看日志是個(gè)啥樣。

都是xml格式的,是不是看著就頭暈了??沒事,我們先來分析一波。
1.每一段開頭都是catalina-exec,那么我們就按catalina-exec來分,分了之后,他們就都是一段一段的了。
2.然后,我們再在已經(jīng)分好的一段段里面分,找出你要分割的關(guān)鍵字,因?yàn)槭莤ml的,所以,接下來的工作就簡單了,都是一個(gè)頭一個(gè)尾的。
3.但是還有一個(gè)問題,有可能有的里面沒有你想要的關(guān)鍵字,所以你要判斷下,如果沒有這個(gè)字段,那么我就把這個(gè)字段設(shè)置為空。
思路清晰了,代碼自然而然就簡單了。
接下來我們就看看代碼
#coding:utf-8
import re
#文本所在TXT文件
file = 'iag_interface.log'
#分割一段
xml1='catalina-exec'
xml2='catalina-exec'
#關(guān)鍵字reqtimestamp
time1 = '<timestamp>'
time2 = '</timestamp>'
#關(guān)鍵字functionid
functionid1 = '<functionid>'
functionid2 = '</functionid>'
#關(guān)鍵字transid
transid1='<transid>'
transid2='</transid>'
#關(guān)鍵字siappid
siappid1='<siappid>'
siappid2='</siappid>'
#關(guān)鍵字userid
userid1='<userid>'
userid2='</userid>'
#關(guān)鍵字mobnum
mobnum1='<mobnum>'
mobnum2='</mobnum>'
f = open(file,'r',encoding= 'utf-8')
#f = open(file,'r')
#for (num,value) in enumerate(f):
#print("line number",num,"is:",value)
buff = f.read()
#清除換行符,請取消下一行注釋
#buff = buff.replace('\n','')
pat = re.compile(time1+'(.*?)'+time2,re.S)
pat1 = re.compile(functionid1+'(.*?)'+functionid2,re.S)
pat2 = re.compile(transid1+'(.*?)'+transid2,re.S)
pat3 = re.compile(siappid1+'(.*?)'+siappid2,re.S)
pat4 = re.compile(userid1+'(.*?)'+userid2,re.S)
pat5 = re.compile(mobnum1+'(.*?)'+mobnum2,re.S)
pat6=re.compile(xml1+'(.*?)'+xml2,re.S)
result6 = pat6.findall(buff)
print(len(result6))
x = open("logfx.txt", 'w')
x.write("===========================開始數(shù)據(jù)================================="+"\n")
x.write("time"+"\t"+"functionid"+"\t"+"transid"+"\t"+"siappid"+"\t"+"userid"+"\t"+"mobnum"+"\n")
for i in range(0,len(result6)):
result = pat.findall(result6[i])
result1 = pat1.findall(result6[i])
result2 = pat2.findall(result6[i])
result3 = pat3.findall(result6[i])
result4 = pat4.findall(result6[i])
result5 = pat5.findall(result6[i])
if len(result)==0:
result.append("空")
if len(result1)==0:
result1.append("空")
if len(result2)==0:
result2.append("空")
if len(result3)==0:
result3.append("空")
if len(result4)==0:
result4.append("空")
if len(result5)==0:
result5.append("空")
#print(result[0],"=",result1[0],"=",result2[0],"=",result3[0],"=",result4[0],"=",result5[0])
x.write("timestamp:"+result[0]+"\t"+result1[0]+"\t"+result2[0]+"\t"+result3[0]+"\t"+result4[0]+"\t"+"mobnum:"+result5[0]+"\n")
x.write("===========================結(jié)束數(shù)據(jù)================================="+"\n")
print("執(zhí)行完畢!生成文件logfx.txt")
x.close()
運(yùn)行下代碼

python解析基于xml格式的日志文件把所有數(shù)據(jù)運(yùn)行成功了。接下來查看文件

好了。
以上就是本文的全部內(nèi)容,希望對大家的學(xué)習(xí)有所幫助,也希望大家多多支持腳本之家。
相關(guān)文章
Python小游戲?qū)崿F(xiàn)實(shí)例之接蘋果
其實(shí)利用Python編寫的小游戲很簡單,下面這篇文章主要給大家介紹了關(guān)于Python小游戲?qū)崿F(xiàn)實(shí)例之接蘋果的相關(guān)資料,文中通過實(shí)例代碼介紹的非常詳細(xì),需要的朋友可以參考下2022-03-03
Python基于輾轉(zhuǎn)相除法求解最大公約數(shù)的方法示例
這篇文章主要介紹了Python基于輾轉(zhuǎn)相除法求解最大公約數(shù)的方法,結(jié)合實(shí)例形式分析了Python使用輾轉(zhuǎn)相除法求解最大公約數(shù)的實(shí)現(xiàn)方法與優(yōu)化操作技巧,需要的朋友可以參考下2018-04-04
Python中時(shí)間類型的JSON數(shù)據(jù)轉(zhuǎn)換
在Python中,處理時(shí)間和日期數(shù)據(jù)以及與JSON數(shù)據(jù)的相互轉(zhuǎn)換是常見的任務(wù),本文主要為大家詳細(xì)如何在Python中處理時(shí)間類型的JSON數(shù)據(jù)轉(zhuǎn)換,需要的小伙伴可以參考下2024-02-02
Python實(shí)現(xiàn)的生成自我描述腳本分享(很有意思的程序)
這篇文章主要介紹了Python實(shí)現(xiàn)的生成自我描述腳本分享,很有意思的程序,繞的人有點(diǎn)頭暈,需要的朋友參考下吧2014-07-07
Python3.10動(dòng)態(tài)修改Windows系統(tǒng)本地IP地址
這篇文章主要介紹了Python3.10動(dòng)態(tài)修改Windows系統(tǒng)本地IP地址,需要的朋友可以參考下2023-05-05
Python實(shí)現(xiàn)K折交叉驗(yàn)證法的方法步驟
這篇文章主要介紹了Python實(shí)現(xiàn)K折交叉驗(yàn)證法的方法步驟,文中通過示例代碼介紹的非常詳細(xì),對大家的學(xué)習(xí)或者工作具有一定的參考學(xué)習(xí)價(jià)值,需要的朋友們下面隨著小編來一起學(xué)習(xí)學(xué)習(xí)吧2019-07-07
Python測試函數(shù)出現(xiàn)AssertionError:None?!=?‘Janis?Joplin‘問題及解決
這篇文章主要介紹了Python測試函數(shù)出現(xiàn)AssertionError:None?!=?‘Janis?Joplin‘問題及解決方案,具有很好的參考價(jià)值,希望對大家有所幫助,如有錯(cuò)誤或未考慮完全的地方,望不吝賜教2023-09-09

