使用python實現(xiàn)正則匹配檢索遠端FTP目錄下的文件
遇到一個問題,需要正則匹配遠端FTP目錄下的文件,如果使用ftp客戶端可以通過命令行很容易的做到這一點,但是暫時沒有一個工具支持這樣的需求,于是通過python對FTP的支持和對正則表達式的支持,寫了這么一個簡單的工具,用于使用正則表達式來匹配遠端目錄的文件。
代碼如下
# coding=utf-8 ######################################################################### # File Name: reg_url.py # Author: WangWeilong # Company: Baidu ######################################################################### import re import sys import os from ftplib import FTP dhccmd = "http://xxx/api/submit" class DHC_FTP(): def __init__(self, hostname, username="", passwd=""): self.hostname = hostname try: self.ftp = FTP(self.hostname) except: print "hostname error!" exit(-1) self.username = username self.passwd = passwd self.filelist = [] self.reg_pattern = "" def getftpfilelist(self, path): self.ftp.login(self.username, self.passwd) self.ftp.cwd(path) self.filelist = self.ftp.nlst() def matchnames(self, regpattern): pattern = re.compile(regpattern) matchedfiles = [] for file in self.filelist: match = pattern.search(file) if match: matchedfiles.append(match.string) return matchedfiles if __name__ == "__main__": if len(sys.argv) != 4: print 'usage:python reg_url.py $ftpurldir $regular' else: #解析ftpurl字符串 head = sys.argv[1].split("@")[1].split("/")[0] username = sys.argv[1].split("http://")[1].split(":")[0] passwd = sys.argv[1].split("http://")[1].split(":")[1].split("@")[0] pathdir = sys.argv[1].split(head)[1] dhc_ftp = DHC_FTP(head, username, passwd) dhc_ftp.getftpfilelist("./" + pathdir) #獲取正則表達式 regpattern = r'%s' % sys.argv[2] matchedfiles = dhc_ftp.matchnames(regpattern) for files in matchedfiles: ftpname = sys.argv[1] + "/" + files print ftpname
通過輸入想要的檢索的遠端目錄地址和想要用來匹配的正則表達式,就能獲取到遠端的文件了,至于用這些文件來干嘛,那就是需求問題了。
以上所述就是本文的全部內(nèi)容了,希望大家能夠喜歡。
請您花一點時間將文章分享給您的朋友或者留下評論。我們將會由衷感謝您的支持!
相關(guān)文章
PyTorch手寫數(shù)字數(shù)據(jù)集進行多分類
這篇文章主要介紹了PyTorch手寫數(shù)字數(shù)據(jù)集進行多分類,損失函數(shù)采用交叉熵,激活函數(shù)采用ReLU,優(yōu)化器采用帶有動量的mini-batchSGD算法,需要的朋友可以參考一下2022-03-03Python3讀寫Excel文件(使用xlrd,xlsxwriter,openpyxl3種方式讀寫實例與優(yōu)劣)
這篇文章主要介紹了Python3讀寫Excel文件,使用xlrd,xlsxwriter,openpyxl3種方式讀寫實例與優(yōu)劣,需要的朋友可以參考下2020-02-02Python練習(xí)之操作SQLite數(shù)據(jù)庫
這篇文章主要介紹了Python練習(xí)之操作SQLite數(shù)據(jù)庫,主要通過三個問題如何創(chuàng)建SQLite數(shù)據(jù)庫?如何向SQLite表中插入數(shù)據(jù)?如何查詢SQLite表中的數(shù)據(jù)?展開文章主題詳情,需要的朋友可以參考一下2022-06-06Python通過pytesseract庫實現(xiàn)識別圖片中的文字
Pytesseract是一個Python的OCR庫,它可以識別圖片中的文本并將其轉(zhuǎn)換成文本形式。本文就來用pytesseract庫實現(xiàn)識別圖片中的文字,感興趣的可以了解一下2023-05-05基于wxPython的GUI實現(xiàn)輸入對話框(2)
這篇文章主要為大家詳細介紹了基于wxPython的GUI實現(xiàn)輸入對話框的第二篇,具有一定的參考價值,感興趣的小伙伴們可以參考一下2019-02-02numpy中的隨機打亂數(shù)據(jù)方法np.random.shuffle解讀
這篇文章主要介紹了numpy中的隨機打亂數(shù)據(jù)方法np.random.shuffle解讀,具有很好的參考價值,希望對大家有所幫助。如有錯誤或未考慮完全的地方,望不吝賜教2023-05-05Pandas時間序列:時期(period)及其算術(shù)運算詳解
今天小編就為大家分享一篇Pandas時間序列:時期(period)及其算術(shù)運算詳解,具有很好的參考價值,希望對大家有所幫助。一起跟隨小編過來看看吧2020-02-02python實現(xiàn)監(jiān)控指定進程的cpu和內(nèi)存使用率
這篇文章主要為大家詳細介紹了python實現(xiàn)監(jiān)控指定進程的cpu和內(nèi)存使用率,文中示例代碼介紹的非常詳細,具有一定的參考價值,感興趣的小伙伴們可以參考一下2022-01-01