欧美bbbwbbbw肥妇,免费乱码人妻系列日韩,一级黄片

Python 分析Nginx訪問(wèn)日志并保存到MySQL數(shù)據(jù)庫(kù)實(shí)例

 更新時(shí)間:2014年03月13日 09:13:56   作者:  
這篇文章主要介紹了Python 分析Nginx訪問(wèn)日志并保存到MySQL數(shù)據(jù)庫(kù)實(shí)例,需要的朋友可以參考下

使用Python 分析Nginx access 日志,根據(jù)Nginx日志格式進(jìn)行分割并存入MySQL數(shù)據(jù)庫(kù)。
一、Nginx access日志格式如下:

復(fù)制代碼 代碼如下:

$remote_addr - $remote_user [$time_local] "$request" $status $body_bytes_sent "$http_referer" "$http_user_agent" "$http_x_forwarded_for"' #使用的是nginx默認(rèn)日志格式

二、Nginx access 日志內(nèi)容如下:
復(fù)制代碼 代碼如下:

182.19.31.129 - - [2013-08-13T00:00:01-07:00] "GET /css/anniversary.css HTTP/1.1" 304 0 "http://www.chlinux.net/" "Mozilla/5.0 (Windows NT 6.1; WOW64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/28.0.1500.95 Safari/537.36" "-"

三、下面是Python 分析nginx日志的Python代碼:
復(fù)制代碼 代碼如下:
#!/usr/bin/env python
#coding:utf8
import os
import fileinput
import re
import sys
import MySQLdb
#日志的位置
logfile=open("access_20130812.log")
#使用的nginx默認(rèn)日志格式$remote_addr - $remote_user [$time_local] "$request" $status $body_bytes_sent "$http_referer" "$http_user_agent" "$http_x_forwarded_for"'
#日志分析正則表達(dá)式
#203.208.60.230
ipP = r"?P<ip>[\d.]*"
#以[開始,除[]以外的任意字符 防止匹配上下個(gè)[]項(xiàng)目(也可以使用非貪婪匹配*?) 不在中括號(hào)里的.可以匹配換行外的任意字符 *這樣地重復(fù)是"貪婪的“ 表達(dá)式引擎會(huì)試著重復(fù)盡可能多的次數(shù)。#以]結(jié)束
#[21/Jan/2011:15:04:41 +0800]
timeP = r"""?P<time>\[[^\[\]]*\]"""
#以"開始, #除雙引號(hào)以外的任意字符 防止匹配上下個(gè)""項(xiàng)目(也可以使用非貪婪匹配*?),#以"結(jié)束
#"GET /EntpShop.do?method=view&shop_id=391796 HTTP/1.1"
#"GET /EntpShop.do?method=view&shop_id=391796 HTTP/1.1"
requestP = r"""?P<request>\"[^\"]*\""""
statusP = r"?P<status>\d+"
bodyBytesSentP = r"?P<bodyByteSent>\d+"
#以"開始, 除雙引號(hào)以外的任意字符 防止匹配上下個(gè)""項(xiàng)目(也可以使用非貪婪匹配*?),#以"結(jié)束
#"http://test.myweb.com/myAction.do?method=view&mod_id=&id=1346"
referP = r"""?P<refer>\"[^\"]*\""""
#以"開始, 除雙引號(hào)以外的任意字符 防止匹配上下個(gè)""項(xiàng)目(也可以使用非貪婪匹配*?),以"結(jié)束
#"Mozilla/5.0 (compatible; Googlebot/2.1; +http://www.google.com/bot.html)"'
userAgentP = r"""?P<userAgent>\"[^\"]*\""""
#以(開始, 除雙引號(hào)以外的任意字符 防止匹配上下個(gè)()項(xiàng)目(也可以使用非貪婪匹配*?),以"結(jié)束
#(compatible; Googlebot/2.1; +http://www.google.com/bot.html)"'
userSystems = re.compile(r'\([^\(\)]*\)')
#以"開始,除雙引號(hào)以外的任意字符防止匹配上下個(gè)""項(xiàng)目(也可以使用非貪婪匹配*?),以"結(jié)束
userlius = re.compile(r'[^\)]*\"')
#原理:主要通過(guò)空格和-來(lái)區(qū)分各不同項(xiàng)目,各項(xiàng)目?jī)?nèi)部寫各自的匹配表達(dá)式
nginxLogPattern = re.compile(r"(%s)\ -\ -\ (%s)\ (%s)\ (%s)\ (%s)\ (%s)\ (%s)" %(ipP, timeP, requestP, statusP, bodyBytesSentP, referP, userAgentP), re.VERBOSE)
#數(shù)據(jù)庫(kù)連接信息
conn=MySQLdb.connect(host='192.168.1.22',user='test',passwd='pass',port=3306,db='python')
cur=conn.cursor()
sql = "INSERT INTO python.test VALUES(%s,%s,%s,%s,%s,%s,%s,%s,%s)"
while True:
    line = logfile.readline()
    if not line:break
    matchs = nginxLogPattern.match(line)
    if matchs != None:
        allGroup = matchs.groups()
        ip = allGroup[0]
        time = allGroup[1]
        request = allGroup[2]
        status = allGroup[3]
        bodyBytesSent = allGroup[4]
        refer = allGroup[5]
        userAgent = allGroup[6]
        Time = time.replace('T',' ')[1:-7]
        if len(userAgent) > 20:
            userinfo = userAgent.split(' ')
            userkel =  userinfo[0]
            try:
                usersystem = userSystems.findall(userAgent)
                usersystem = usersystem[0]
                print usersystem
                userliu = userlius.findall(userAgent)
                value = [ip,Time,request,status,bodyBytesSent,refer,userkel,usersystem,userliu[1]]
                conn.commit()
                print value
            except IndexError:
                userinfo = userAgent
                value = [ip,Time,request,status,bodyBytesSent,refer,userinfo,"",""]
        else:
            useraa = userAgent
            value = [ip,Time,request,status,bodyBytesSent,refer,useraa,"",""]
    try:
        result = cur.execute(sql,value)
        #conn.commit()
        print result
    except MySQLdb.Error,e:
        print "Mysql Error %d: %s" % (e.args[0], e.args[1])
conn.commit()
conn.close()

四、存入數(shù)據(jù)庫(kù)后數(shù)據(jù)是如下圖:

相關(guān)文章

  • zookeeper python接口實(shí)例詳解

    zookeeper python接口實(shí)例詳解

    這篇文章主要介紹了zookeeper python接口實(shí)例詳解,具有一定借鑒價(jià)值,需要的朋友可以參考下
    2018-01-01
  • Python Matplotlib繪制多子圖詳解

    Python Matplotlib繪制多子圖詳解

    Matplotlib是Python中最受歡迎的數(shù)據(jù)可視化軟件包之一,它是 Python常用的2D繪圖庫(kù),同時(shí)它也提供了一部分3D繪圖接口。本文將詳細(xì)介紹如何通過(guò)Matplotlib繪制多子圖,以及合并圖例和調(diào)整子圖間距,需要的可以參考一下
    2022-02-02
  • Python實(shí)現(xiàn)繪制3D條形圖的示例詳解

    Python實(shí)現(xiàn)繪制3D條形圖的示例詳解

    這篇文章主要為大家學(xué)習(xí)介紹了如何利用Python實(shí)現(xiàn)繪制3D條形圖,文中的示例代碼講解詳細(xì),具有一定的學(xué)習(xí)價(jià)值,感興趣的小伙伴可以了解一下
    2023-07-07
  • pandas中的數(shù)據(jù)去重處理的實(shí)現(xiàn)方法

    pandas中的數(shù)據(jù)去重處理的實(shí)現(xiàn)方法

    這篇文章主要介紹了pandas中的數(shù)據(jù)去重處理的實(shí)現(xiàn)方法,文中通過(guò)示例代碼介紹的非常詳細(xì),對(duì)大家的學(xué)習(xí)或者工作具有一定的參考學(xué)習(xí)價(jià)值,需要的朋友們下面隨著小編來(lái)一起學(xué)習(xí)學(xué)習(xí)吧
    2020-02-02
  • 導(dǎo)入tensorflow時(shí)報(bào)錯(cuò):cannot import name ''abs''的解決

    導(dǎo)入tensorflow時(shí)報(bào)錯(cuò):cannot import name ''abs''的解決

    這篇文章主要介紹了導(dǎo)入tensorflow時(shí)報(bào)錯(cuò):cannot import name 'abs'的解決,文中介紹的非常詳細(xì),對(duì)大家的學(xué)習(xí)或者工作具有一定的參考學(xué)習(xí)價(jià)值,需要的朋友們下面隨著小編來(lái)一起學(xué)習(xí)學(xué)習(xí)吧
    2019-10-10
  • Python執(zhí)行系統(tǒng)命令的五種方式小結(jié)

    Python執(zhí)行系統(tǒng)命令的五種方式小結(jié)

    在日常開發(fā)中,有時(shí)需要在Python腳本中執(zhí)行系統(tǒng)命令,Python有五種方式來(lái)執(zhí)行系統(tǒng)命令(推薦使用第五種),本文為大家整理了這五種方法的具體使用,希望對(duì)大家有所幫助
    2024-01-01
  • Android 兼容性問(wèn)題:java.lang.UnsupportedOperationException解決辦法

    Android 兼容性問(wèn)題:java.lang.UnsupportedOperationException解決辦法

    這篇文章主要介紹了Android 兼容性問(wèn)題:java.lang.UnsupportedOperationException解決辦法的相關(guān)資料,需要的朋友可以參考下
    2017-03-03
  • 詳解opencv去除背景算法的方法比較

    詳解opencv去除背景算法的方法比較

    本文主要介紹了opencv去除背景算法的方法比較,文中通過(guò)示例代碼介紹的非常詳細(xì),對(duì)大家的學(xué)習(xí)或者工作具有一定的參考學(xué)習(xí)價(jià)值,需要的朋友們下面隨著小編來(lái)一起學(xué)習(xí)學(xué)習(xí)吧
    2022-08-08
  • python numpy庫(kù)linspace相同間隔采樣的實(shí)現(xiàn)

    python numpy庫(kù)linspace相同間隔采樣的實(shí)現(xiàn)

    這篇文章主要介紹了python numpy庫(kù)linspace相同間隔采樣的實(shí)現(xiàn),具有很好的參考價(jià)值,希望對(duì)大家有所幫助。一起跟隨小編過(guò)來(lái)看看吧
    2020-02-02
  • 教你使用Python實(shí)現(xiàn)一個(gè)簡(jiǎn)易版Web服務(wù)器

    教你使用Python實(shí)現(xiàn)一個(gè)簡(jiǎn)易版Web服務(wù)器

    這篇文章主要介紹了教你使用Python實(shí)現(xiàn)一個(gè)簡(jiǎn)易版Web服務(wù)器,本篇文章將通過(guò)實(shí)現(xiàn)一個(gè)簡(jiǎn)易版的Web服務(wù)器,幫助讀者理解Python網(wǎng)絡(luò)編程的基本概念和技巧,需要的朋友可以參考下
    2023-04-04

最新評(píng)論