python反爬蟲(chóng)方法的優(yōu)缺點(diǎn)分析
我們選擇一種問(wèn)題的解決辦法,通常需要考慮到想要達(dá)到的效果,還有最重要的是這個(gè)辦法本身的優(yōu)缺點(diǎn)有哪些,與其他的方法對(duì)比哪一個(gè)更好。之前小編之前也教過(guò)大家在python應(yīng)對(duì)反爬蟲(chóng)的方法,那么小伙伴們知道具體情況下選擇哪一種辦法更適合嗎?今天就其中的user-agent和ip代碼兩個(gè)辦法進(jìn)行優(yōu)缺點(diǎn)分析比較,讓大家可以明確不同辦法的區(qū)別從而進(jìn)行選擇。
方法一:
可以自己設(shè)置一下user-agent,或者更好的是,可以從一系列的user-agent里隨機(jī)挑出一個(gè)符合標(biāo)準(zhǔn)的使用。
缺點(diǎn):
容易偽造頭部,github上有人分享開(kāi)源庫(kù)fake-useragent
IP限制
如果一個(gè)固定的ip在短暫的時(shí)間內(nèi),快速大量的訪問(wèn)一個(gè)網(wǎng)站,后臺(tái)管理員可以編寫(xiě)IP限制,不讓該IP繼續(xù)訪問(wèn)。
方法二:
比較成熟的方式是:IP代理池
簡(jiǎn)單的說(shuō),就是通過(guò)ip代理,從不同的ip進(jìn)行訪問(wèn),這樣就不會(huì)被封掉ip了。
可是ip代理的獲取本身就是一個(gè)很麻煩的事情,網(wǎng)上有免費(fèi)和付費(fèi)的,但是質(zhì)量都層次不齊。如果是企業(yè)里需要的話,可以通過(guò)自己購(gòu)買(mǎi)集群云服務(wù)來(lái)自建代理池。
缺點(diǎn):
可以使用免費(fèi)/付費(fèi)代理,繞過(guò)檢測(cè)。
讀完本篇我們會(huì)發(fā)現(xiàn),每種方法都有它的缺陷,我們要做的就是發(fā)揮使用它的優(yōu)勢(shì)出。根據(jù)不同的環(huán)境情況,可以選擇適合自己操作順手的方法。對(duì)于兩種方法知識(shí)點(diǎn)遺忘的,可以直接點(diǎn)擊進(jìn)去進(jìn)行回顧。
到此這篇關(guān)于python反爬蟲(chóng)方法的優(yōu)缺點(diǎn)分析的文章就介紹到這了,更多相關(guān)python解決反爬蟲(chóng)方法的優(yōu)缺點(diǎn)對(duì)比內(nèi)容請(qǐng)搜索腳本之家以前的文章或繼續(xù)瀏覽下面的相關(guān)文章希望大家以后多多支持腳本之家!
- Requests什么的通通爬不了的Python超強(qiáng)反爬蟲(chóng)方案!
- 用sleep間隔進(jìn)行python反爬蟲(chóng)的實(shí)例講解
- python 常見(jiàn)的反爬蟲(chóng)策略
- Python常見(jiàn)反爬蟲(chóng)機(jī)制解決方案
- 用python3 urllib破解有道翻譯反爬蟲(chóng)機(jī)制詳解
- Python反爬蟲(chóng)技術(shù)之防止IP地址被封殺的講解
- Python3爬蟲(chóng)學(xué)習(xí)之應(yīng)對(duì)網(wǎng)站反爬蟲(chóng)機(jī)制的方法分析
- Python中常見(jiàn)的反爬機(jī)制及其破解方法總結(jié)
相關(guān)文章
Python尾遞歸優(yōu)化實(shí)現(xiàn)代碼及原理詳解
這篇文章主要介紹了Python尾遞歸優(yōu)化實(shí)現(xiàn)代碼及原理詳解,文中通過(guò)示例代碼介紹的非常詳細(xì),對(duì)大家的學(xué)習(xí)或者工作具有一定的參考學(xué)習(xí)價(jià)值,需要的朋友可以參考下2020-10-10Python?NumPy教程之?dāng)?shù)據(jù)類(lèi)型對(duì)象詳解
每個(gè)?ndarray?都有一個(gè)關(guān)聯(lián)的數(shù)據(jù)類(lèi)型?(dtype)?對(duì)象。這個(gè)數(shù)據(jù)類(lèi)型對(duì)象(dtype)告訴我們數(shù)組的布局。本文將通過(guò)示例詳細(xì)講講NumPy的數(shù)據(jù)類(lèi)型對(duì)象,需要的可以參考一下2022-08-08Python+matplotlib實(shí)現(xiàn)量場(chǎng)圖的繪制
matplotlib是基于Python語(yǔ)言的開(kāi)源項(xiàng)目,pyplot提供一系列繪制2D圖形的方法。本文將帶大家學(xué)習(xí)matplotlib.pyplot.quiver()相關(guān)方法屬性并通過(guò)其繪制量場(chǎng)圖2021-12-12如何使用python爬取知乎熱榜Top50數(shù)據(jù)
主要是爬取知乎熱榜的問(wèn)題及點(diǎn)贊數(shù)比較高的答案,通過(guò)requests請(qǐng)求庫(kù)進(jìn)行爬取,對(duì)大家的學(xué)習(xí)或工作具有一定的價(jià)值,需要的朋友可以參考下2021-09-09常用python數(shù)據(jù)類(lèi)型轉(zhuǎn)換函數(shù)總結(jié)
這篇文章主要介紹了常用的python數(shù)據(jù)類(lèi)型轉(zhuǎn)換函數(shù),并用實(shí)際例子說(shuō)明了這些函數(shù)的用法,需要的朋友可以參考下2014-03-03跟老齊學(xué)Python之?dāng)?shù)據(jù)類(lèi)型總結(jié)
前面已經(jīng)洋洋灑灑地介紹了不少數(shù)據(jù)類(lèi)型。不能再不顧一切地向前沖了,應(yīng)當(dāng)總結(jié)一下。這樣讓看官能夠從總體上對(duì)這些數(shù)據(jù)類(lèi)型有所了解,如果能夠有一覽眾山小的感覺(jué),就太好了。2014-09-098個(gè)Python必備的PyCharm插件(附下載地址)
Python是一種廣泛使用的編程語(yǔ)言,PyCharm是最受歡迎的Python IDE之一,本文就來(lái)介紹一下8個(gè)Python必備的PyCharm插件,具有一定的參考價(jià)值,感興趣的可以了解一下2024-01-01