欧美bbbwbbbw肥妇,免费乱码人妻系列日韩,一级黄片

簡單示例解析python爬蟲IP的使用(小白篇)

 更新時間:2023年06月26日 10:12:21   作者:小白學(xué)大數(shù)據(jù)  
這篇文章主要為大家通過簡單示例解析python爬蟲IP的使用介紹,有需要的朋友可以借鑒參考下,希望能夠有所幫助,祝大家多多進(jìn)步,早日升職加薪

創(chuàng)建一個IP池并對其進(jìn)行管理

Python爬蟲常常會面臨自己ip地址被封的情況,也許剛?cè)胄械男“拙椭荒艿萯p解封之后再進(jìn)行接下來的操作了,但是這樣的方式卻是最不能借鑒的,萬一數(shù)據(jù)需求量大,那要等到猴年馬月呢?所以今天我們就來探討下如何創(chuàng)建一個IP池并對其進(jìn)行管理。對剛?cè)胄械男“缀苡袔椭?希望大家耐心看下去,需要的朋友可以參考下。

很多的網(wǎng)站都有反爬機(jī)制,其中就有這樣一條,就是服務(wù)器會檢查請求的user-agent參數(shù)值,如果檢查的結(jié)果為python,那么服務(wù)器就知道這是爬蟲,所以為了避免被服務(wù)器發(fā)現(xiàn)這是爬蟲,我們需要添加隨機(jī)user-agen。這樣就可以避免服務(wù)器發(fā)現(xiàn)這是同一個user-agent發(fā)起多次請求。

還有一條就是網(wǎng)站會封IP,一般這樣的情況就直接添加代理IP就可以,那么,從哪里獲取IP呢?小編用的是億牛云的這個網(wǎng)址,網(wǎng)址鏈接為:https://www.16yun.cn/,。

動態(tài)轉(zhuǎn)發(fā)代理

很多小白會問怎么使用IP,這里介紹一種最簡單方便的方式,那就是動態(tài)轉(zhuǎn)發(fā)代理,我們接下來分享個示例供大家參考下:

#! -- encoding:utf-8 --

import requests
import random
# 要訪問的目標(biāo)頁面
targetUrl = "http://httpbin.org/ip"
# 要訪問的目標(biāo)HTTPS頁面
# targetUrl = "https://httpbin.org/ip"
# 代理服務(wù)器(產(chǎn)品官網(wǎng) www.16yun.cn)
proxyHost = "t.16yun.cn"
proxyPort = "31111"
# 代理驗證信息
proxyUser = "username"
proxyPass = "password"
proxyMeta = "http://%(user)s:%(pass)s@%(host)s:%(port)s" % {
    "host" : proxyHost,
    "port" : proxyPort,
    "user" : proxyUser,
    "pass" : proxyPass,
}
# 設(shè)置 http和https訪問都是用HTTP代理
proxies = {
    "http"  : proxyMeta,
    "https" : proxyMeta,
}
#  設(shè)置IP切換頭
tunnel = random.randint(1,10000)
headers = {"Proxy-Tunnel": str(tunnel)}
resp = requests.get(targetUrl, proxies=proxies, headers=headers)
print resp.status_code
print resp.text

驗證

那我們在添加了代理IP之后怎么驗證使用的ip是否可用?這里我們可以通過訪問IP檢測網(wǎng)址驗證:

http://current.ip.16yun.cn:802,只要返回的是代理IP那么就證明代理使用成功了,我們可以直接去訪問需要獲取的數(shù)據(jù)網(wǎng)站了。

以上就是簡單示例解析python爬蟲IP的使用的詳細(xì)內(nèi)容,更多關(guān)于python爬蟲IP使用的資料請關(guān)注腳本之家其它相關(guān)文章!

相關(guān)文章

  • Python實現(xiàn)的插入排序,冒泡排序,快速排序,選擇排序算法示例

    Python實現(xiàn)的插入排序,冒泡排序,快速排序,選擇排序算法示例

    這篇文章主要介紹了Python實現(xiàn)的插入排序,冒泡排序,快速排序,選擇排序算法,結(jié)合實例形式總結(jié)分析了Python插入排序,冒泡排序,快速排序,選擇排序等算法的實現(xiàn)與使用技巧,需要的朋友可以參考下
    2019-05-05
  • Python中的“_args”和“__kwargs”用法詳解

    Python中的“_args”和“__kwargs”用法詳解

    *args 和 **kwargs 主要?于函數(shù)定義,你可以將不定數(shù)量的參數(shù)傳遞給?個函數(shù),這篇文章主要介紹了Python中的“_args”和“__kwargs”用法,需要的朋友可以參考下
    2023-01-01
  • python2 與 pyhton3的輸入語句寫法小結(jié)

    python2 與 pyhton3的輸入語句寫法小結(jié)

    這篇文章主要給大家介紹了關(guān)于python2 與 pyhton3的輸入語句寫法,文中通過示例代碼介紹的非常詳細(xì),對大家的學(xué)習(xí)或者工作具有一定的參考學(xué)習(xí)價值,需要的朋友們下面隨著小編來一起學(xué)習(xí)學(xué)習(xí)吧
    2018-09-09
  • Python 正則表達(dá)式的高級用法

    Python 正則表達(dá)式的高級用法

    作為一個概念而言,正則表達(dá)式對于Python來說并不是獨有的。但是,Python中的正則表達(dá)式在實際使用過程中還是有一些細(xì)小的差別。本文是一系列關(guān)于Python正則表達(dá)式文章的其中一部分。
    2016-12-12
  • Python進(jìn)行文件處理的示例詳解

    Python進(jìn)行文件處理的示例詳解

    這篇文章主要通過幾個簡單的示例,為大家詳細(xì)介紹一下Python實現(xiàn)文件處理的方法,文中的示例代碼講解詳細(xì),感興趣的小伙伴可以跟隨小編一起學(xué)習(xí)一下
    2023-02-02
  • Python中selenium_webdriver下拉框操作指南

    Python中selenium_webdriver下拉框操作指南

    selenium 雖然過了這么多年,但是到目前為止依然是比較流行的自動化框架了,下面這篇文章主要給大家介紹了關(guān)于Python中selenium_webdriver下拉框操作的相關(guān)資料,文中通過實例代碼介紹的非常詳細(xì),需要的朋友可以參考下
    2022-01-01
  • 淺析python字符串前加r、f、u、l 的區(qū)別

    淺析python字符串前加r、f、u、l 的區(qū)別

    這篇文章主要介紹了淺析python字符串前加r、f、u、l 的區(qū)別,本文給大家介紹的非常詳細(xì),對大家的學(xué)習(xí)或工作具有一定的參考借鑒價值,需要的朋友可以參考下
    2021-01-01
  • 詳細(xì)分析Python collections工具庫

    詳細(xì)分析Python collections工具庫

    這篇文章主要介紹了詳解Python collections工具庫的相關(guān)資料,文中講解非常細(xì)致,代碼幫助大家更好的理解和學(xué)習(xí),感興趣的朋友可以了解下
    2020-07-07
  • Tensorflow分類器項目自定義數(shù)據(jù)讀入的實現(xiàn)

    Tensorflow分類器項目自定義數(shù)據(jù)讀入的實現(xiàn)

    這篇文章主要介紹了Tensorflow分類器項目自定義數(shù)據(jù)讀入的實現(xiàn),小編覺得挺不錯的,現(xiàn)在分享給大家,也給大家做個參考。一起跟隨小編過來看看吧
    2019-02-02
  • python保留兩位小數(shù)的3種方法實例

    python保留兩位小數(shù)的3種方法實例

    保留小數(shù)位是我們經(jīng)常會碰到的問題,尤其是刷題過程中,下面這篇文章主要給大家介紹了關(guān)于python保留兩位小數(shù)的3種方法,文中通過示例代碼介紹的非常詳細(xì),需要的朋友可以參考下
    2022-12-12

最新評論