欧美bbbwbbbw肥妇,免费乱码人妻系列日韩,一级黄片

基于Python實現(xiàn)大文件分割和命名腳本過程解析

 更新時間:2019年09月29日 08:20:04   作者:HoLoong  
這篇文章主要介紹了基于Python實現(xiàn)大文件分割和命名腳本過程解析,文中通過示例代碼介紹的非常詳細(xì),對大家的學(xué)習(xí)或者工作具有一定的參考學(xué)習(xí)價值,需要的朋友可以參考下

日志文件分割、命名

工作中經(jīng)常會收到測試同學(xué)、客戶同學(xué)提供的日志文件,其中不乏幾百M一G的也都有,畢竟壓測一晚上產(chǎn)生的日志量還是很可觀的,xDxD,因此不可避免的需要對日志進行分割,通常定位問題需要針對時間點,因此最好對分割后的日志文件使用文件中日志的開始、結(jié)束時間點來命名,這樣使用起來最為直觀,下面給大家分享兩個腳本,分別作分割、命名,希望能夠給大家提供一點點幫助;

大文件分割

用法:

  • python split_big_file.py
  • 輸入文件全路徑名
  • 輸入期望的分割后每個小文件的行數(shù)
  • Just wait.
 # -*- coding:utf-8 -*-

 import os,re,shutil
 import platform

 sys_name = platform.system().lower()
 SPLIT_CHAR = '\\' if sys_name.find('windows') != -1 else '/'

 print('input big files`s path:')
 _path = raw_input()
 names = []
 pathes = []
 if os.path.isfile(_path):
   print('is file')
   names.append(_path)
 else:
   print('is nothing')
 '''
 elif os.path.isdir(_path):
   print('This is dir')
   pathes = os.listdir(_path)
   print('pathes='+str(pathes))
   for i in range(len(pathes)):
     fullpath = _path+SPLIT_CHAR+pathes[i]
     print('fullpath='+fullpath)
     if os.path.isfile(fullpath):
       names.append(fullpath)
       files.append(open(fullpath).read().split('\n'))
 '''

 print(len(names))

 line_num = int(raw_input('every file`line num = '))
 print('line number='+str(line_num))

 for i in range(len(names)):
   _name = names[i]
   ori_name = _name.split(SPLIT_CHAR)[len(_name.split(SPLIT_CHAR))-1]
   dir_name = _name.replace(ori_name,'DIR_'+ori_name)
   dir_name = dir_name.replace('.','_')
   print ori_name
   print dir_name
   os.system('mkdir '+dir_name)
   count = 1
   print '已處理:'+str(count)+'行'
   part_file = open(dir_name+SPLIT_CHAR+str(0)+'.part.txt','w')
   with open(_name, 'rb') as f:
     for line in f:
     if count%line_num == 0:
       part_file.close()
       part_file = open(dir_name+SPLIT_CHAR+str(int(count/line_num))+'.part.txt','w')
     part_file.write(line+'\n')
     count+=1
     if count%100000 == 0:
       print '已處理:'+str(count)+'行'
   print '已處理:'+str(count)+'行'
   os.system('python ./get_name_logfile.py '+dir_name)

文件按照開始、結(jié)束行時間戳重命名

用法:

python get_name_logfile.py log.txt

python get_name_logfile.py logs

參數(shù)選擇文件或者文件夾均可,如果是文件夾,則會針對文件夾中的每個文件做處理(不會遞歸到文件夾下文件夾中的文件哦);

  # -*- coding:utf-8 -*-


  import os,re,shutil
  import sys
  import platform

  sys_name = platform.system().lower()
  SPLIT_CHAR = '\\' if sys_name.find('windows') != -1 else '/'

  _path = sys.argv[1]
  names = []
  files = []
  pathes = []
  if os.path.isfile(_path):
    print('is file')
    names[0] = _path
  elif os.path.isdir(_path):
    print('This is dir')
    pathes = os.listdir(_path)
    print('pathes='+str(pathes))
    for i in range(len(pathes)):
      fullpath = _path+SPLIT_CHAR+pathes[i]
      print('fullpath='+fullpath)
      if os.path.isfile(fullpath):
        names.append(fullpath)
  else:
    print('is nothing')
    
  print(len(names))

  #  日期格式 : 05-26 18:20:42.093  r'\d{4}-\d{2}-\d{2}T\d{2}:\d{2}:\d{2}.\d{3}'
  #  
  #  05-26 18:20:43.093:r'\d{2}-\d{2} {1,}\d{2}:\d{2}:\d{2}.\d{1,10}'

  date_reg = r'\d{2}-\d{2} {1,}\d{2}:\d{2}:\d{2}.\d{1,10}'
  time_reg = r'\d{2}:\d{2}:\d{2}.\d{1,10}'

  for i in range(len(names)):
    _name = names[i]
    print('name='+_name)
    # head 嘗試在10行內(nèi)查找日期
    head_len = 10
    start_time = '(start_time-'
    _file_ = open(_name, 'rb')
    reads = _file_.read()
    _file = reads.split('\n')
    if len(_file)/2 < 10:
      head_len = len(_file)/2
    for j in range(head_len):
      res = re.search(date_reg, _file[j])
      if res!=None and res.group(0)!=None:
        start_time = res.group(0)
        print('start_time='+start_time)
        break
    # tail
    tail_len = len(_file)-head_len
    end_time = '-end_time)'
    for j in range(len(_file)-1,tail_len-1,-1):
      res = re.search(time_reg, _file[j])
      if res!=None and res.group(0)!=None:
        end_time = res.group(0)
        print('end_time='+end_time)
        break
    _file_.close()
    ori_name = _name.split(SPLIT_CHAR)[len(_name.split(SPLIT_CHAR))-1]
    print('ori_name='+ori_name)
    new_name = start_time.replace(':','-')+'__'+end_time.replace(':','-')+os.path.splitext(ori_name)[1]
    print('new_name='+new_name)
    print("copy %s %s" % (_name, _name.replace(ori_name,new_name)))
    #os.system ("copy %s %s" % (_name, _name.replace(ori_name,new_name)))
    shutil.copy(_name,_name.replace(ori_name,new_name))
    os.system ("rm -rf "+_name)

以上就是本文的全部內(nèi)容,希望對大家的學(xué)習(xí)有所幫助,也希望大家多多支持腳本之家。

相關(guān)文章

  • Python 含參構(gòu)造函數(shù)實例詳解

    Python 含參構(gòu)造函數(shù)實例詳解

    這篇文章主要介紹了Python 含參構(gòu)造函數(shù)實例詳解的相關(guān)資料,需要的朋友可以參考下
    2017-05-05
  • python?魔法方法之?__?slots?__的實現(xiàn)

    python?魔法方法之?__?slots?__的實現(xiàn)

    本文主要介紹了python?魔法方法之?__?slots?__的實現(xiàn),文中通過示例代碼介紹的非常詳細(xì),對大家的學(xué)習(xí)或者工作具有一定的參考學(xué)習(xí)價值,需要的朋友們下面隨著小編來一起學(xué)習(xí)學(xué)習(xí)吧
    2023-03-03
  • Python統(tǒng)計詞頻的幾種方法小結(jié)

    Python統(tǒng)計詞頻的幾種方法小結(jié)

    本文主要介紹了Python統(tǒng)計詞頻的幾種方法小結(jié),文中通過示例代碼介紹的非常詳細(xì),對大家的學(xué)習(xí)或者工作具有一定的參考學(xué)習(xí)價值,需要的朋友們下面隨著小編來一起學(xué)習(xí)學(xué)習(xí)吧
    2023-03-03
  • Python 遍歷字典的8種方法總結(jié)

    Python 遍歷字典的8種方法總結(jié)

    遍歷字典是Python中常見的操作,可以很方便的訪問字典中的鍵和值,以執(zhí)行各種任務(wù),本文將介紹Python中遍歷字典的8種方法,包括for循環(huán)、字典方法和推導(dǎo)式等,需要的朋友可以參考下
    2023-10-10
  • python通過opencv調(diào)用攝像頭操作實例分析

    python通過opencv調(diào)用攝像頭操作實例分析

    在本篇文章里小編給大家整理的是一篇關(guān)于python通過opencv調(diào)用攝像頭操作實例分析內(nèi)容,有興趣的朋友們可以學(xué)習(xí)下。
    2021-06-06
  • python中的turtle庫函數(shù)簡單使用教程

    python中的turtle庫函數(shù)簡單使用教程

    這篇文章主要介紹了python中的turtle庫函數(shù)簡單使用教程。本文通過圖片的形式給大家展示的非常詳細(xì),具有一定的參考借鑒價值,需要的朋友參考下吧
    2018-07-07
  • Python wheel文件詳細(xì)介紹

    Python wheel文件詳細(xì)介紹

    wheel是新的Python的disribution,用于替代Python傳統(tǒng)的egg文件。目前有超過一半的庫文件有對應(yīng)的wheel文件,文中通過示例代碼介紹的非常詳細(xì),對大家的學(xué)習(xí)或者工作具有一定的參考學(xué)習(xí)價值,需要的朋友們下面隨著小編來一起學(xué)習(xí)吧
    2022-09-09
  • 簡單了解python 郵件模塊的使用方法

    簡單了解python 郵件模塊的使用方法

    這篇文章主要介紹了簡單了解python 郵件模塊的使用方法,文中通過示例代碼介紹的非常詳細(xì),對大家的學(xué)習(xí)或者工作具有一定的參考學(xué)習(xí)價值,需要的朋友可以參考下
    2019-07-07
  • Python中最大遞歸深度值的探討

    Python中最大遞歸深度值的探討

    今天小編就為大家分享一篇關(guān)于Python中最大遞歸深度值的探討,小編覺得內(nèi)容挺不錯的,現(xiàn)在分享給大家,具有很好的參考價值,需要的朋友一起跟隨小編來看看吧
    2019-03-03
  • 利用Python提取PDF文本的簡單方法實例

    利用Python提取PDF文本的簡單方法實例

    日常工作中我們經(jīng)常會用到pdf格式的文件,大多數(shù)情況下是瀏覽或者編輯pdf信息,但有時候需要提取pdf中的文本,下面這篇文章主要給大家介紹了關(guān)于利用Python提取PDF文本的簡單方法,需要的朋友可以參考下
    2022-07-07

最新評論