Python利用watchdog模塊監(jiān)控文件變化
假設(shè)現(xiàn)在有一個應(yīng)用場景,需要對文件系統(tǒng)進行監(jiān)控,發(fā)生變化時產(chǎn)生日志,對新增的文件做一些相應(yīng)的操作。
比如說應(yīng)用到我們之前的音樂高潮提取器:若當(dāng)前文件夾下增加了一個音樂文件,監(jiān)控器就調(diào)用音樂高潮提取器,自動提取該音樂文件的高潮部分。
這樣的監(jiān)控器寫起來也不難,但是很花時間,有許多情況要考慮。不過幸好我們是寫Python的,有許多輪子可以使用,本文介紹的就是一個名為 watchdog 的模塊,它能幫助我們實現(xiàn)上述功能。
1.準備
開始之前,你要確保Python和pip已經(jīng)成功安裝在電腦上,如果沒有,可以訪問這篇文章:超詳細Python安裝指南 進行安裝。
如果你用Python的目的是數(shù)據(jù)分析,可以直接安裝Anaconda,它內(nèi)置了Python和pip.
Windows環(huán)境下打開Cmd(開始—運行—CMD),蘋果系統(tǒng)環(huán)境下請打開Terminal(command+空格輸入Terminal),準備開始輸入命令安裝依賴。
當(dāng)然,我更推薦大家用VSCode編輯器,把本文代碼Copy下來,在編輯器下方的終端運行命令安裝依賴模塊,多舒服的一件事啊
在終端輸入以下命令安裝我們所需要的依賴模塊:
pip?install?watchdog
看到 Successfully installed xxx 則說明安裝成功。
2.基本使用
看門狗的使用并不復(fù)雜,請認真看以下代碼和注釋:
import sys import time import logging from watchdog.observers import Observer from watchdog.events import LoggingEventHandler if __name__ == "__main__": logging.basicConfig(level=logging.INFO, format='%(asctime)s - %(message)s', datefmt='%Y-%m-%d %H:%M:%S') path = sys.argv[1] if len(sys.argv) > 1 else '.' # 生成事件處理器對象 event_handler = LoggingEventHandler() # 生成監(jiān)控器對象 observer = Observer() # 注冊事件處理器,配置監(jiān)控目錄 observer.schedule(event_handler, path, recursive=True) # 監(jiān)控器啟動——創(chuàng)建線程 observer.start() # 以下代碼是為了保持主線程運行 try: while True: time.sleep(1) except KeyboardInterrupt: observer.stop() # 主線程任務(wù)結(jié)束之后,進入阻塞狀態(tài),一直等待其他的子線程執(zhí)行結(jié)束之后,主線程再終止 observer.join()
可以看到代碼中有幾個關(guān)鍵步驟,
1.配置各項信息;
2.生成事件處理器、監(jiān)控器;
3.注冊事件處理器、配置目錄、遞歸執(zhí)行(即同時監(jiān)控子文件夾);
4:啟動。
其實,看門狗的observer是基于threading.Thread
對象的,所以observer很多屬性都繼承了 threading.Thread 的屬性。
如果你不帶參數(shù)地運行該腳本,就是要監(jiān)控腳本文件所在的文件夾,如果要監(jiān)控其他文件夾,記得運行時帶文件夾的路徑參數(shù),如:
python obserber.py /data/home/ckend/
我們來試著運行看看:
可以看到,我在當(dāng)前文件夾下做的所有操作都被記錄下來了。接下來我們就試試怎么自定義一些操作。
3.監(jiān)控文件變化
如果你不知道怎么提取音樂文件的高潮部分,請看這篇文章:《Python自動提取音樂文件高潮》。
要實現(xiàn)這樣的功能,我們有幾種方法,一個是在原來log的處理器上做一些新增修改,比如多增一個函數(shù)調(diào)用音樂高潮提取器。第二個是重新繼承 FileSystemEventHandler 類,并做相應(yīng)的修改。這里我們還是要保留log的樣式,只是在log的時候順便提取音樂高潮,因此采用第一個方法。
看看 LoggingEventHandler
源代碼中的 on_created
,這就是當(dāng)文件創(chuàng)建時監(jiān)控器的操作:
class LoggingEventHandler(FileSystemEventHandler): """Logs all the events captured.""" ? # ...省略其他源代碼... ? def on_created(self, event): super(LoggingEventHandler, self).on_created(event) ? what = 'directory' if event.is_directory else 'file' logging.info("Created %s: %s", what, event.src_path)
我們僅需要繼承這個類并對 on_created
進行修改,就能完成我們想要的功能:
# Python實用寶典 # 2019/12/29 import sys import time import logging from watchdog.observers import Observer from watchdog.events import LoggingEventHandler from pychorus import find_and_output_chorus class extractor(LoggingEventHandler): def on_created(self, event): super(LoggingEventHandler, self).on_created(event) what = 'directory' if event.is_directory else 'file' logging.info("Created %s: %s", what, event.src_path) NameExt = event.src_path.split('.') if NameExt[-1] == 'mp3': logging.info("mp3文件, 提取音樂高潮中...") output_path = "."+"".join(NameExt[:-1])+'_high.wav' find_and_output_chorus(event.src_path, output_path, 30) if __name__ == "__main__": logging.basicConfig(level=logging.INFO, format='%(asctime)s - %(message)s', datefmt='%Y-%m-%d %H:%M:%S') path = sys.argv[1] if len(sys.argv) > 1 else '.' # 生成事件處理器對象 event_handler = extractor() # 生成監(jiān)控器對象 observer = Observer() # 注冊事件處理器 observer.schedule(event_handler, path, recursive=True) # 監(jiān)控器啟動——創(chuàng)建線程 observer.start() # 以下代碼是為了保持主線程運行 try: while True: time.sleep(1) except KeyboardInterrupt: observer.stop() # 主線程任務(wù)結(jié)束之后,進入阻塞狀態(tài),一直等待其他的子線程執(zhí)行結(jié)束之后,主線程再終止 observer.join()
首先聲明一個類,繼承 LoggingEventHandler
,然后重載 on_created
函數(shù),在這個函數(shù)中不僅記錄文件事件變化,還要對mp3文件做一次音樂高潮提取。最后別忘了,生成事件處理器時要用我們新的類名。
看看效果,將小永遠.mp3復(fù)制過來:
成功監(jiān)控文件變化并提取到音樂高潮,生成高潮文件。這樣,只要你保持這個Python進程不關(guān)閉,它就會一直監(jiān)控這個文件夾,一旦有音樂文件進入,就會自動提取它的音樂高潮,在linux系統(tǒng)下,可以搭配supervisor使用,非常好用。
到此這篇關(guān)于Python利用watchdog模塊監(jiān)控文件變化的文章就介紹到這了,更多相關(guān)Python watchdog模塊內(nèi)容請搜索腳本之家以前的文章或繼續(xù)瀏覽下面的相關(guān)文章希望大家以后多多支持腳本之家!
相關(guān)文章
Python實現(xiàn)的服務(wù)器示例小結(jié)【單進程、多進程、多線程、非阻塞式】
這篇文章主要介紹了Python實現(xiàn)的服務(wù)器,結(jié)合實例形式分析了Python實現(xiàn)單進程、多進程、多線程、非阻塞式服務(wù)器的相關(guān)操作技巧,需要的朋友可以參考下2019-05-05解決Linux系統(tǒng)中python matplotlib畫圖的中文顯示問題
這篇文章主要介紹了解決Linux系統(tǒng)中python matplotlib畫圖的中文顯示問題,需要的朋友可以參考下2017-06-06在Python開發(fā)環(huán)境中調(diào)用ChatGPT模型詳細過程
在開發(fā)過程當(dāng)中時常需要使用 ChatGPT 來完成一些任務(wù),但總是使用網(wǎng)頁交互模式去 Web 端訪問 ChatGPT 是很麻煩的,這時候我們可以使用代碼來調(diào)用 ChatGPT 模型,本文將詳細介紹在 Python 開發(fā)環(huán)境中調(diào)用 ChatGPT 模型過程,,需要的朋友可以參考下2023-05-05