Python多線程的退出控制實(shí)現(xiàn)
日常前言
最近接 到一個(gè)搶票的爬蟲外包,那個(gè)網(wǎng)站及其之撈,訪問(wèn)購(gòu)票地址竟然還要排隊(duì),在購(gòu)票高峰臨時(shí)升一下服務(wù)器配置不行嗎…沒(méi)辦法,甲方爸爸的要求還得做啊,其中一個(gè)障礙便是目標(biāo)網(wǎng)站的后端限制了訪問(wèn)頻次,俗話說(shuō):“上有政策,下有對(duì)策?!?立刻想到了多線程 + 多代理
的方式進(jìn)行訪問(wèn)。
但此時(shí)問(wèn)題便來(lái)了,多代理還好說(shuō),再寫個(gè)爬蟲爬一堆下來(lái)就好,多線程可就麻煩多了,多線程一旦發(fā)出去了,基本等同于失控的狀態(tài),你無(wú)法去結(jié)束或者是重啟一個(gè)線程,最多只能是獲取線程的信息,沒(méi)有實(shí)際的控制權(quán),而且Python官方也沒(méi)有提供相應(yīng)的結(jié)束函數(shù)。那么接下來(lái),讓我們來(lái)好好聊聊解決這個(gè)問(wèn)題的思路。
單線程的結(jié)束
說(shuō)實(shí)話,會(huì)百度在程序世界是一個(gè)優(yōu)秀的習(xí)慣,不然怎么會(huì)有這么一張表情包呢
但是百度這一次卻不盡人意,搜了很久,結(jié)果不盡人意,基本上所有的搜索結(jié)果都告訴我只有結(jié)束單個(gè)線程的方法,我也試過(guò)循環(huán)使用百度的結(jié)束函數(shù),但最終都只能是結(jié)束的當(dāng)前的這一個(gè)線程,無(wú)法達(dá)到目標(biāo)。
貼一段搜到的單線程結(jié)束代碼示例
def _async_raise(tid, exctype): tid = ctypes.c_long(tid) if not inspect.isclass(exctype): exctype = type(exctype) res = ctypes.pythonapi.PyThreadState_SetAsyncExc(tid, ctypes.py_object(exctype)) if res == 0: raise ValueError("invalid thread id") elif res != 1: ctypes.pythonapi.PyThreadState_SetAsyncExc(tid, None) raise SystemError("PyThreadState_SetAsyncExc failed") def stop_thread(thread): _async_raise(thread.ident, SystemExit)
那怎么結(jié)束多個(gè)線程呢?
既然度娘也搜不到,那就自己探索,打開python threading模塊的官方文檔,其中一個(gè)daemon
屬性進(jìn)入了視野,單詞翻譯過(guò)來(lái)便是守護(hù)進(jìn)程,相信大家應(yīng)該或多或少的聽到過(guò),以下是官方的釋義,大概意思就是只要在啟動(dòng)線程之前設(shè)置了這個(gè)屬性為True,當(dāng)父進(jìn)程結(jié)束時(shí),所有的子進(jìn)程跟著全部結(jié)束,這樣就好辦了,接下來(lái)看看代碼部分。
daemon
A boolean value indicating whether this thread is a daemon thread (True) or not (False). This must be set before start() is called, otherwise RuntimeError is raised. Its initial value is inherited from the creating thread; the main thread is not a daemon thread and therefore all threads created in the main thread default to daemon = False.
完整代碼
import threading,time,random class Messy: def __init__(self): self.__messy = 0 def m(self,i): # 隨機(jī)時(shí)間進(jìn)行打印 time.sleep(random.random()*2) print(i) if i == 1: self.__messy = 1 def main(self): Threads = [] # 將會(huì)啟動(dòng)10個(gè)線程,線程id為 1 時(shí)全部線程終止! for i in range(10): t = threading.Thread(target=self.m,args=(i,)) t.daemon = 1 Threads.append(t) # 啟動(dòng)所有線程 for i in Threads: i.start() # 當(dāng)標(biāo)志位【 messy 】時(shí)所有多線程結(jié)束 while 1: if self.__messy: break print('線程已退出!') Messy().main() # 繼續(xù)執(zhí)行后續(xù)程序 for i in range(5): print('yeah!')
此時(shí),main
這個(gè)函數(shù)對(duì)于多線程來(lái)講,便是父進(jìn)程,也就是守護(hù)進(jìn)程。預(yù)計(jì)會(huì)進(jìn)行10次循環(huán)的數(shù)字打印,但是當(dāng)self.__messy
這個(gè)標(biāo)志位為真時(shí),所有的剩余子線程將不會(huì)再執(zhí)行,直接結(jié)束進(jìn)行后續(xù)的操作
e.g:如下圖便只打印了四次
最后
目前來(lái)講,用設(shè)置主線程退出的方法是可以完成現(xiàn)在這個(gè)搶票的目標(biāo)。
但是后來(lái)發(fā)現(xiàn)其實(shí)這么做也會(huì)帶來(lái)很多壞處,直接殺掉所有子線程對(duì)系統(tǒng)來(lái)說(shuō)是一個(gè)很粗魯?shù)男袨?,如果涉及到的操作包括?code>文件數(shù)據(jù)、數(shù)據(jù)庫(kù)數(shù)據(jù)的改動(dòng)的話,內(nèi)存無(wú)法被合理釋放(之前就遇到過(guò)CPU莫名占用滿),極有可能造成數(shù)據(jù)丟失甚至系統(tǒng)中斷
。
我這里只是一個(gè)搶票的小程序,子線程只用到了POST,網(wǎng)絡(luò)請(qǐng)求中斷帶來(lái)的影響還是相對(duì)來(lái)講比較小的,所以大家酌情使用本篇所介紹的方法。
本文作者: Messy
原文鏈接:https://www.messys.top/detail/78
到此這篇關(guān)于Python多線程的退出控制實(shí)現(xiàn)的文章就介紹到這了,更多相關(guān)Python多線程退出控制內(nèi)容請(qǐng)搜索腳本之家以前的文章或繼續(xù)瀏覽下面的相關(guān)文章希望大家以后多多支持腳本之家!
- Python控制線程和函數(shù)超時(shí)處理
- python如何控制進(jìn)程或者線程的個(gè)數(shù)
- python多線程semaphore實(shí)現(xiàn)線程數(shù)控制的示例
- python基于event實(shí)現(xiàn)線程間通信控制
- python子線程退出及線程退出控制的代碼
- python多線程同步之文件讀寫控制
- python自定義線程池控制線程數(shù)量的示例
- Python多線程同步---文件讀寫控制方法
- python簡(jiǎn)易遠(yuǎn)程控制單線程版
- Python控制多進(jìn)程與多線程并發(fā)數(shù)總結(jié)
- Python多線程中線程數(shù)量如何控制
相關(guān)文章
numpy數(shù)據(jù)類型dtype轉(zhuǎn)換實(shí)現(xiàn)
這篇文章主要介紹了numpy數(shù)據(jù)類型dtype轉(zhuǎn)換實(shí)現(xiàn),文中通過(guò)示例代碼介紹的非常詳細(xì),對(duì)大家的學(xué)習(xí)或者工作具有一定的參考學(xué)習(xí)價(jià)值,需要的朋友們下面隨著小編來(lái)一起學(xué)習(xí)學(xué)習(xí)吧2021-04-04python使用循環(huán)實(shí)現(xiàn)批量創(chuàng)建文件夾示例
這篇文章主要介紹了python使用循環(huán)實(shí)現(xiàn)批量創(chuàng)建文件夾示例,需要的朋友可以參考下2014-03-03Python中如何使用Matplotlib庫(kù)繪制圖形
Matplotlib是一個(gè)Python的2D繪圖庫(kù),通過(guò)Matplotlib開發(fā)者可以僅需要幾行代碼,便可以生成繪圖,直方圖,功率譜,條形圖,錯(cuò)誤圖,散點(diǎn)圖等,這篇文章主要給大家介紹了Python中如何使用Matplotlib庫(kù)繪制圖形的相關(guān)資料2022-07-07寫一個(gè)Python腳本下載嗶哩嗶哩舞蹈區(qū)的所有視頻
B 站大家都熟悉,尤其是它的舞蹈區(qū).有 100W+ 的舞蹈視頻.在沒(méi)有 wifi 的情況下,就欣賞不了這些視頻了.作為一個(gè) python 程序員,小編就寫一個(gè) Python 腳本在晚上下載舞蹈區(qū)的所有視頻,需要的朋友可以參考下2021-05-05如何利用python多線程爬取天氣網(wǎng)站圖片并保存
最近做個(gè)天 氣方面的APP需要用到一些天氣數(shù)據(jù),所以下面這篇文章主要給大家介紹了關(guān)于如何利用python多線程爬取天氣網(wǎng)站圖片并保存的相關(guān)資料,文中通過(guò)示例代碼介紹的非常詳細(xì),需要的朋友可以參考下2021-11-11pytorch cuda上tensor的定義 以及減少cpu的操作詳解
這篇文章主要介紹了pytorch cuda上tensor的定義 以及減少cpu的操作詳解,具有很好的參考價(jià)值,希望對(duì)大家有所幫助。一起跟隨小編過(guò)來(lái)看看吧2020-06-06