欧美bbbwbbbw肥妇,免费乱码人妻系列日韩,一级黄片

<sup id="od5up"></sup>

<u id="od5up"></u>

利用Python爬取可用的代理IP

更新時間：2016年08月18日 15:47:18 投稿：daisy

我們平時在用Python爬蟲時，有時會要用到IP代理。網(wǎng)上有很多的免費(fèi)代理IP網(wǎng)站,但不是所有的ip都能用，所以這篇文章教大家如何爬取可用的代理IP。

前言

就以最近發(fā)現(xiàn)的一個免費(fèi)代理IP網(wǎng)站為例：http://www.xicidaili.com/nn/。在使用的時候發(fā)現(xiàn)很多IP都用不了。

所以用Python寫了個腳本，該腳本可以把能用的代理IP檢測出來。

腳本如下：

#encoding=utf8
import urllib2
from bs4 import BeautifulSoup
import urllib
import socket
 
User_Agent = 'Mozilla/5.0 (Windows NT 6.3; WOW64; rv:43.0) Gecko/20100101 Firefox/43.0'
header = {}
header['User-Agent'] = User_Agent
 
'''
獲取所有代理IP地址
'''
def getProxyIp():
 proxy = []
 for i in range(1,2):
  try:
   url = 'http://www.xicidaili.com/nn/'+str(i)
   req = urllib2.Request(url,headers=header)
   res = urllib2.urlopen(req).read()
   soup = BeautifulSoup(res)
   ips = soup.findAll('tr')
   for x in range(1,len(ips)):
    ip = ips[x]
    tds = ip.findAll("td")
    ip_temp = tds[1].contents[0]+"\t"+tds[2].contents[0]
    proxy.append(ip_temp)
  except:
   continue
 return proxy
  
'''
驗證獲得的代理IP地址是否可用
'''
def validateIp(proxy):
 url = "http://ip.chinaz.com/getip.aspx"
 f = open("E:\ip.txt","w")
 socket.setdefaulttimeout(3)
 for i in range(0,len(proxy)):
  try:
   ip = proxy[i].strip().split("\t")
   proxy_host = "http://"+ip[0]+":"+ip[1]
   proxy_temp = {"http":proxy_host}
   res = urllib.urlopen(url,proxies=proxy_temp).read()
   f.write(proxy[i]+'\n')
   print proxy[i]
  except Exception,e:
   continue
 f.close()
 
    
if __name__ == '__main__':
 proxy = getProxyIp()
 validateIp(proxy)

運(yùn)行成功后，打開E盤下的文件，可以看到如下可用的代理IP地址和端口：

總結(jié)

這只是爬取的第一頁的IP地址，如有需要，可以多爬取幾頁。同時，該網(wǎng)站是時時更新的，建議爬取時只爬取前幾頁的即可。以上就是本文的全部內(nèi)容，希望對大家學(xué)習(xí)使用Python能有所幫助。

您可能感興趣的文章:

相關(guān)文章

python之如何復(fù)制excel模板并保留表格樣式
這篇文章主要介紹了python之如何復(fù)制excel模板并保留表格樣式問題，具有很好的參考價值，希望對大家有所幫助。如有錯誤或未考慮完全的地方，望不吝賜教
2023-06-06
詳解使用python crontab設(shè)置linux定時任務(wù)
本篇文章主要介紹了使用python crontab設(shè)置linux定時任務(wù)，具有一定的參考價值，有需要的可以了解一下。
2016-12-12
使用cx_freeze把python打包exe示例
這篇文章主要介紹了使用cx_freeze把python打包成exe的示例，大家參考使用吧
2014-01-01
解決echarts中餅圖標(biāo)簽重疊的問題
這篇文章主要介紹了解決echarts中餅圖標(biāo)簽重疊的問題，具有很好的參考價值，希望對大家有所幫助。一起跟隨小編過來看看吧
2020-05-05
Python 高級庫15 個讓新手愛不釋手(推薦)
對于初學(xué)者來說，這是一種簡單易學(xué)的編程語言；另一個原因：大量開箱即用的第三方庫，正是 23 萬個由用戶提供的軟件包使得 Python 真正強(qiáng)大和流行，本文給大家分享15 個讓新手愛不釋手Python 高級庫的相關(guān)知識，感興趣的朋友一起看看吧
2021-05-05
解決django后臺樣式丟失,css資源加載失敗的問題
今天小編就為大家分享一篇解決django后臺樣式丟失,css資源加載失敗的問題，具有很好的參考價值，希望對大家有所幫助。一起跟隨小編過來看看吧
2019-06-06
python實現(xiàn)暗通道去霧算法的示例
這篇文章主要介紹了python實現(xiàn)暗通道去霧算法的示例，幫助大家更好的利用python處理圖像，感興趣的朋友可以了解下
2020-09-09
使用python如何對圖片進(jìn)行壓縮
這篇文章主要介紹了使用python如何對圖片進(jìn)行壓縮，具有很好的參考價值，希望對大家有所幫助。如有錯誤或未考慮完全的地方，望不吝賜教
2022-11-11
Pycharm遠(yuǎn)程連接服務(wù)器并運(yùn)行與調(diào)試
本篇文章介紹一下 Pycharm 如何配置遠(yuǎn)程連接信息，使其能夠在本地使用服務(wù)器上的GPU等硬件資源，并在本地完成代碼的運(yùn)行與調(diào)試，感興趣的可以了解一下
2021-08-08
使用Python的PEAK來適配協(xié)議的教程
這篇文章主要介紹了使用Python的PEAK來適配協(xié)議的教程,來自于IBM官方網(wǎng)站技術(shù)文檔,需要的朋友可以參考下
2015-04-04

最新評論

<ruby id="l3wua"><samp id="l3wua"><form id="l3wua"></form></samp></ruby><p id="l3wua"></p>

<tt id="l3wua"><sup id="l3wua"></sup></tt>

<mark id="l3wua"></mark>

<ruby id="l3wua"><font id="l3wua"><del id="l3wua"></del></font></ruby>