欧美bbbwbbbw肥妇,免费乱码人妻系列日韩,一级黄片

Python爬蟲使用代理IP的實現(xiàn)

 更新時間:2019年10月27日 16:32:47   作者:Steven·簡談  
這篇文章主要介紹了Python爬蟲使用代理IP的實現(xiàn),文中通過示例代碼介紹的非常詳細(xì),對大家的學(xué)習(xí)或者工作具有一定的參考學(xué)習(xí)價值,需要的朋友們下面隨著小編來一起學(xué)習(xí)學(xué)習(xí)吧

使用爬蟲時,如果目標(biāo)網(wǎng)站對訪問的速度或次數(shù)要求較高,那么你的 IP 就很容易被封掉,也就意味著在一段時間內(nèi)無法再進(jìn)行下一步的工作。這時候代理 IP 能夠給我們帶來很大的便利,不管網(wǎng)站怎么封,只要能找到一個新的代理 IP 就可以繼續(xù)進(jìn)行下一步的研究。

目前很多網(wǎng)站都提供了一些免費(fèi)的代理 IP 供我們使用,當(dāng)然付費(fèi)的會更好用一點。本文除了展示怎樣使用代理 IP,也正好體驗一下前面文章中搭建的代理 IP 池,不知道的可以點擊這里:Python搭建代理IP池(一)- 獲取 IP。只要訪問代理池提供的接口就可以獲取到代理 IP 了,接下來就看怎樣使用吧!

測試的網(wǎng)址是:http://httpbin.org/get,訪問該站點可以得到請求的一些相關(guān)信息,其中 origin 字段就是客戶端的 IP,根據(jù)它來判斷代理是否設(shè)置成功,也就是是否成功偽裝了IP

獲取 IP

代理池使用 Flask 提供了獲取的接口:http://localhost:5555/random

只要訪問這個接口再返回內(nèi)容就可以拿到 IP 了

Urllib

先看一下 Urllib 的代理設(shè)置方法:

from urllib.error import URLError
import urllib.request
from urllib.request import ProxyHandler, build_opener

# 獲取IP
ip_response = urllib.request.urlopen("http://localhost:5555/random")
ip = ip_response.read().decode('utf-8')

proxy_handler = ProxyHandler({
  'http': 'http://' + ip,
  'https': 'https://' + ip
})
opener = build_opener(proxy_handler)
try:
  response = opener.open('http://httpbin.org/get')
  print(response.read().decode('utf-8'))
except URLError as e:
  print(e.reason)

運(yùn)行結(jié)果:

{
 "args": {},
 "headers": {
  "Accept-Encoding": "identity",
  "Host": "httpbin.org",
  "User-Agent": "Python-urllib/3.7"
 },
 "origin": "108.61.201.231, 108.61.201.231",
 "url": "https://httpbin.org/get"
} 

Urllib 使用 ProxyHandler 設(shè)置代理,參數(shù)是字典類型,鍵名為協(xié)議類型,鍵值是代理,代理前面需要加上協(xié)議,即 http 或 https,當(dāng)請求的鏈接是 http 協(xié)議的時候,它會調(diào)用 http 代理,當(dāng)請求的鏈接是 https 協(xié)議的時候,它會調(diào)用https代理,所以此處生效的代理是:http://108.61.201.231 和 https://108.61.201.231

ProxyHandler 對象創(chuàng)建之后,再利用 build_opener() 方法傳入該對象來創(chuàng)建一個 Opener,這樣就相當(dāng)于此 Opener 已經(jīng)設(shè)置好代理了,直接調(diào)用它的 open() 方法即可使用此代理訪問鏈接

Requests

Requests 的代理設(shè)置只需要傳入 proxies 參數(shù):

import requests

# 獲取IP
ip_response = requests.get("http://localhost:5555/random")
ip = ip_response.text

proxies = {
  'http': 'http://' + ip,
  'https': 'https://' + ip,
}
try:
  response = requests.get('http://httpbin.org/get', proxies=proxies)
  print(response.text)
except requests.exceptions.ConnectionError as e:
  print('Error', e.args)

運(yùn)行結(jié)果:

{
 "args": {},
 "headers": {
  "Accept": "*/*",
  "Accept-Encoding": "gzip, deflate",
  "Host": "httpbin.org",
  "User-Agent": "python-requests/2.21.0"
 },
 "origin": "47.90.28.54, 47.90.28.54",
 "url": "https://httpbin.org/get"
}

Requests 只需要構(gòu)造代理字典然后通過 proxies 參數(shù)即可設(shè)置代理,比較簡單

Selenium

import requests
from selenium import webdriver
import time

# 借助requests庫獲取IP
ip_response = requests.get("http://localhost:5555/random")
ip = ip_response.text

chrome_options = webdriver.ChromeOptions()
chrome_options.add_argument('--proxy-server=http://' + ip)
browser = webdriver.Chrome(chrome_options=chrome_options)
browser.get('http://httpbin.org/get')
time.sleep(5)

運(yùn)行結(jié)果:

以上就是本文的全部內(nèi)容,希望對大家的學(xué)習(xí)有所幫助,也希望大家多多支持腳本之家。

相關(guān)文章

  • PyQt5固定窗口大小的方法

    PyQt5固定窗口大小的方法

    今天小編就為大家分享一篇PyQt5固定窗口大小的方法,具有很好的參考價值,希望對大家有所幫助。一起跟隨小編過來看看吧
    2019-06-06
  • Python中__call__用法實例

    Python中__call__用法實例

    這篇文章主要介紹了Python中__call__用法,需要的朋友可以參考下
    2014-08-08
  • python 讀取以空格分開的文件操作

    python 讀取以空格分開的文件操作

    這篇文章主要介紹了python 讀取以空格分開的文件操作,具有很好的參考價值,希望對大家有所幫助。一起跟隨小編過來看看吧
    2021-04-04
  • 使用python解析xml成對應(yīng)的html示例分享

    使用python解析xml成對應(yīng)的html示例分享

    這篇文章主要介紹了使用python解析xml成對應(yīng)的html示例,需要的朋友可以參考下
    2014-04-04
  • Python中pymysql 模塊的使用詳解

    Python中pymysql 模塊的使用詳解

    pymsql是Python中操作MySQL的模塊,其使用方法和MySQLdb幾乎相同。但目前pymysql支持python3.x而后者不支持3.x版本。
    2019-08-08
  • TensorFlow安裝及jupyter notebook配置方法

    TensorFlow安裝及jupyter notebook配置方法

    下面小編就為大家?guī)硪黄猅ensorFlow安裝及jupyter notebook配置方法。小編覺得挺不錯的,現(xiàn)在就分享給大家,也給大家做個參考。一起跟隨小編過來看看吧
    2017-09-09
  • Ubuntu下安裝卸載python3.8的過程

    Ubuntu下安裝卸載python3.8的過程

    這篇文章主要介紹了Ubuntu下python3.8的安裝與卸載,本文以在 Ubuntu 16.04 中安裝為例,方法同樣適用于 Ubuntu 18.04,需要的朋友可以參考下
    2021-09-09
  • Appium+Python自動化環(huán)境搭建實例教程

    Appium+Python自動化環(huán)境搭建實例教程

    這篇文章主要介紹了Appium+Python自動化環(huán)境搭建實例教程,本文通過實例代碼圖文相結(jié)合給大家介紹的非常詳細(xì),對大家的學(xué)習(xí)或工作具有一定的參考借鑒價值,需要的朋友可以參考下
    2021-08-08
  • 淺談Python中eval的強(qiáng)大與危害

    淺談Python中eval的強(qiáng)大與危害

    這篇文章主要介紹了Python中eval的強(qiáng)大與危害,文中通過示例代碼介紹的非常詳細(xì),對大家的學(xué)習(xí)或者工作具有一定的參考學(xué)習(xí)價值,需要的朋友們下面隨著小編來一起學(xué)習(xí)學(xué)習(xí)吧
    2019-03-03
  • Python中線程threading.Thread的使用詳解

    Python中線程threading.Thread的使用詳解

    python的thread模塊是比較底層的模塊,python的threading模塊是對thread做了一些包裝的,可以更加方便的被使用。本文將為大家詳細(xì)介紹一下python中的線程threading.Thread()的使用,需要的可以參考一下
    2022-07-07

最新評論