使用python實(shí)現(xiàn)正則匹配檢索遠(yuǎn)端FTP目錄下的文件
遇到一個(gè)問(wèn)題,需要正則匹配遠(yuǎn)端FTP目錄下的文件,如果使用ftp客戶(hù)端可以通過(guò)命令行很容易的做到這一點(diǎn),但是暫時(shí)沒(méi)有一個(gè)工具支持這樣的需求,于是通過(guò)python對(duì)FTP的支持和對(duì)正則表達(dá)式的支持,寫(xiě)了這么一個(gè)簡(jiǎn)單的工具,用于使用正則表達(dá)式來(lái)匹配遠(yuǎn)端目錄的文件。
代碼如下
# coding=utf-8
#########################################################################
# File Name: reg_url.py
# Author: WangWeilong
# Company: Baidu
#########################################################################
import re
import sys
import os
from ftplib import FTP
dhccmd = "http://xxx/api/submit"
class DHC_FTP():
def __init__(self, hostname, username="", passwd=""):
self.hostname = hostname
try:
self.ftp = FTP(self.hostname)
except:
print "hostname error!"
exit(-1)
self.username = username
self.passwd = passwd
self.filelist = []
self.reg_pattern = ""
def getftpfilelist(self, path):
self.ftp.login(self.username, self.passwd)
self.ftp.cwd(path)
self.filelist = self.ftp.nlst()
def matchnames(self, regpattern):
pattern = re.compile(regpattern)
matchedfiles = []
for file in self.filelist:
match = pattern.search(file)
if match:
matchedfiles.append(match.string)
return matchedfiles
if __name__ == "__main__":
if len(sys.argv) != 4:
print 'usage:python reg_url.py $ftpurldir $regular'
else:
#解析ftpurl字符串
head = sys.argv[1].split("@")[1].split("/")[0]
username = sys.argv[1].split("http://")[1].split(":")[0]
passwd = sys.argv[1].split("http://")[1].split(":")[1].split("@")[0]
pathdir = sys.argv[1].split(head)[1]
dhc_ftp = DHC_FTP(head, username, passwd)
dhc_ftp.getftpfilelist("./" + pathdir)
#獲取正則表達(dá)式
regpattern = r'%s' % sys.argv[2]
matchedfiles = dhc_ftp.matchnames(regpattern)
for files in matchedfiles:
ftpname = sys.argv[1] + "/" + files
print ftpname
通過(guò)輸入想要的檢索的遠(yuǎn)端目錄地址和想要用來(lái)匹配的正則表達(dá)式,就能獲取到遠(yuǎn)端的文件了,至于用這些文件來(lái)干嘛,那就是需求問(wèn)題了。
以上所述就是本文的全部?jī)?nèi)容了,希望大家能夠喜歡。
請(qǐng)您花一點(diǎn)時(shí)間將文章分享給您的朋友或者留下評(píng)論。我們將會(huì)由衷感謝您的支持!
- Python利用正則表達(dá)式匹配并截取指定子串及去重的方法
- python正則表達(dá)式去掉數(shù)字中的逗號(hào)(python正則匹配逗號(hào))
- Python基于正則表達(dá)式實(shí)現(xiàn)檢查文件內(nèi)容的方法【文件檢索】
- Python基于正則表達(dá)式實(shí)現(xiàn)文件內(nèi)容替換的方法
- python使用正則搜索字符串或文件中的浮點(diǎn)數(shù)代碼實(shí)例
- python實(shí)現(xiàn)刪除文件與目錄的方法
- python遍歷文件夾并刪除特定格式文件的示例
- python2.7刪除文件夾和刪除文件代碼實(shí)例
- Python刪除空文件和空文件夾的方法
- Python編程實(shí)現(xiàn)正則刪除命令功能
相關(guān)文章
PyTorch手寫(xiě)數(shù)字?jǐn)?shù)據(jù)集進(jìn)行多分類(lèi)
這篇文章主要介紹了PyTorch手寫(xiě)數(shù)字?jǐn)?shù)據(jù)集進(jìn)行多分類(lèi),損失函數(shù)采用交叉熵,激活函數(shù)采用ReLU,優(yōu)化器采用帶有動(dòng)量的mini-batchSGD算法,需要的朋友可以參考一下2022-03-03
python編程開(kāi)發(fā)之日期操作實(shí)例分析
這篇文章主要介紹了python編程開(kāi)發(fā)之日期操作,以實(shí)例形式較為詳細(xì)的分析了Python中datetime與time庫(kù)的相關(guān)使用技巧,具有一定參考借鑒價(jià)值,需要的朋友可以參考下2015-11-11
Python3讀寫(xiě)Excel文件(使用xlrd,xlsxwriter,openpyxl3種方式讀寫(xiě)實(shí)例與優(yōu)劣)
這篇文章主要介紹了Python3讀寫(xiě)Excel文件,使用xlrd,xlsxwriter,openpyxl3種方式讀寫(xiě)實(shí)例與優(yōu)劣,需要的朋友可以參考下2020-02-02
Python練習(xí)之操作SQLite數(shù)據(jù)庫(kù)
這篇文章主要介紹了Python練習(xí)之操作SQLite數(shù)據(jù)庫(kù),主要通過(guò)三個(gè)問(wèn)題如何創(chuàng)建SQLite數(shù)據(jù)庫(kù)?如何向SQLite表中插入數(shù)據(jù)?如何查詢(xún)SQLite表中的數(shù)據(jù)?展開(kāi)文章主題詳情,需要的朋友可以參考一下2022-06-06
Python通過(guò)pytesseract庫(kù)實(shí)現(xiàn)識(shí)別圖片中的文字
Pytesseract是一個(gè)Python的OCR庫(kù),它可以識(shí)別圖片中的文本并將其轉(zhuǎn)換成文本形式。本文就來(lái)用pytesseract庫(kù)實(shí)現(xiàn)識(shí)別圖片中的文字,感興趣的可以了解一下2023-05-05
基于wxPython的GUI實(shí)現(xiàn)輸入對(duì)話(huà)框(2)
這篇文章主要為大家詳細(xì)介紹了基于wxPython的GUI實(shí)現(xiàn)輸入對(duì)話(huà)框的第二篇,具有一定的參考價(jià)值,感興趣的小伙伴們可以參考一下2019-02-02
numpy中的隨機(jī)打亂數(shù)據(jù)方法np.random.shuffle解讀
這篇文章主要介紹了numpy中的隨機(jī)打亂數(shù)據(jù)方法np.random.shuffle解讀,具有很好的參考價(jià)值,希望對(duì)大家有所幫助。如有錯(cuò)誤或未考慮完全的地方,望不吝賜教2023-05-05
Pandas時(shí)間序列:時(shí)期(period)及其算術(shù)運(yùn)算詳解
今天小編就為大家分享一篇Pandas時(shí)間序列:時(shí)期(period)及其算術(shù)運(yùn)算詳解,具有很好的參考價(jià)值,希望對(duì)大家有所幫助。一起跟隨小編過(guò)來(lái)看看吧2020-02-02
python實(shí)現(xiàn)監(jiān)控指定進(jìn)程的cpu和內(nèi)存使用率
這篇文章主要為大家詳細(xì)介紹了python實(shí)現(xiàn)監(jiān)控指定進(jìn)程的cpu和內(nèi)存使用率,文中示例代碼介紹的非常詳細(xì),具有一定的參考價(jià)值,感興趣的小伙伴們可以參考一下2022-01-01

