欧美bbbwbbbw肥妇,免费乱码人妻系列日韩,一级黄片

python爬蟲(chóng)請(qǐng)求頭設(shè)置代碼

 更新時(shí)間:2020年07月28日 14:06:15   作者:yang  
在本篇文章里小編給大家整理的是一篇關(guān)于python爬蟲(chóng)請(qǐng)求頭如何設(shè)置內(nèi)容,需要的朋友們可以學(xué)習(xí)下。

一、requests設(shè)置請(qǐng)求頭:

import requests

url="http://www.targetweb.com"

headers={

'Accept':'text/html,application/xhtml+xml,application/xml;q=0.9,image/webp,*/*;q=0.8',

'Cache-Control':'max-age=0',

'Connection':'keep-alive',

'Referer':'http://www.baidu.com/',

'User-Agent':'Mozilla/5.0 (Windows NT 6.1; WOW64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/53.0.2785.104 Safari/537.36 Core/1.53.4882.400 QQBrowser/9.7.13059.400'}

res=requests.get(url,headers=headers)

#圖片下載時(shí)要用到字節(jié)流,請(qǐng)求方式如下

#res=requests.get(url,stream=True,headers)

二、Selenium+Chrome請(qǐng)求頭設(shè)置:

from selenium import webdriver
options = webdriver.ChromeOptions()
options.add_argument('lang=zh_CN.UTF-8')# 設(shè)置中文
options.add_argument('user-agent="Mozilla/5.0 (Windows NT 6.1; WOW64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/53.0.2785.104 Safari/537.36 Core/1.53.4882.400 QQBrowser/9.7.13059.400"')# 設(shè)置頭部
browser = webdriver.Chrome(chrome_options=options)
url="http://www.targetweb.com"
browser.get(url)
browser.quit()

三、selenium+phantomjs請(qǐng)求頭設(shè)置:

from selenium import webdriver
from selenium.webdriver.common.desired_capabilities import DesiredCapabilities
des_cap = dict(DesiredCapabilities.PHANTOMJS)
des_cap["phantomjs.page.settings.userAgent"] = ("Mozilla/5.0 (Windows NT 6.1; WOW64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/53.0.2785.104 Safari/537.36 Core/1.53.4882.400 QQBrowser/9.7.13059.400")
browser = webdriver.PhantomJS(desired_capabilities=des_cap)
url="http://www.targetweb.com"
browser.get(url)
browser.quit()

四、爬蟲(chóng)框架scrapy設(shè)置請(qǐng)求頭:

在settings.py文件中添加如下:

DEFAULT_REQUEST_HEADERS = {
'accept': 'image/webp,*/*;q=0.8',
'accept-language': 'zh-CN,zh;q=0.8',
'referer': 'https://www.baidu.com/',
'user-agent': 'Mozilla/5.0 (Windows NT 6.1; WOW64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/53.0.2785.104 Safari/537.36 Core/1.53.4882.400 QQBrowser/9.7.13059.400',}

五、Python異步Aiohttp請(qǐng)求頭設(shè)置:

import aiohttp
url="http://www.targetweb.com"
headers={
'Accept':'text/html,application/xhtml+xml,application/xml;q=0.9,image/webp,*/*;q=0.8',
'Cache-Control':'max-age=0',
'Connection':'keep-alive',
'Referer':'http://www.baidu.com/',
'User-Agent':'Mozilla/5.0 (Windows NT 6.1; WOW64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/53.0.2785.104 Safari/537.36 Core/1.53.4882.400 QQBrowser/9.7.13059.400'}
asyncwithaiohttp.ClientSession(headers=headers)assession:
asyncwithsession.get(url)asresp:
print(resp.status)
print(awaitresp.text())

內(nèi)容擴(kuò)展:

1、為什么要設(shè)置headers? 

在請(qǐng)求網(wǎng)頁(yè)爬取的時(shí)候,輸出的text信息中會(huì)出現(xiàn)抱歉,無(wú)法訪(fǎng)問(wèn)等字眼,這就是禁止爬取,需要通過(guò)反爬機(jī)制去解決這個(gè)問(wèn)題。

headers是解決requests請(qǐng)求反爬的方法之一,相當(dāng)于我們進(jìn)去這個(gè)網(wǎng)頁(yè)的服務(wù)器本身,假裝自己本身在爬取數(shù)據(jù)。

對(duì)反爬蟲(chóng)網(wǎng)頁(yè),可以設(shè)置一些headers信息,模擬成瀏覽器取訪(fǎng)問(wèn)網(wǎng)站 。

2、 headers在哪里找? 

谷歌或者火狐瀏覽器,在網(wǎng)頁(yè)面上點(diǎn)擊:右鍵–>檢查–>剩余按照?qǐng)D中顯示操作,需要按Fn+F5刷新出網(wǎng)頁(yè)來(lái) 

有的瀏覽器是點(diǎn)擊:右鍵->查看元素,刷新

以上就是python爬蟲(chóng)請(qǐng)求頭設(shè)置代碼的詳細(xì)內(nèi)容,更多關(guān)于python爬蟲(chóng)請(qǐng)求頭如何設(shè)置的資料請(qǐng)關(guān)注腳本之家其它相關(guān)文章!

相關(guān)文章

  • 使用Python繪制空氣質(zhì)量日歷圖

    使用Python繪制空氣質(zhì)量日歷圖

    這篇文章主要介紹了使用Python繪制空氣質(zhì)量日歷圖,文章基于Python繪制的相關(guān)知識(shí)展開(kāi)對(duì)空氣質(zhì)量日歷圖的繪制,感興趣的小伙伴可以參考一下
    2022-05-05
  • python?scapy抓包獲取udp并轉(zhuǎn)發(fā)的操作步驟

    python?scapy抓包獲取udp并轉(zhuǎn)發(fā)的操作步驟

    這篇文章主要介紹了python?scapy抓包獲取udp并轉(zhuǎn)發(fā)的操作步驟,本文給大家介紹的非常詳細(xì),對(duì)大家的學(xué)習(xí)或工作具有一定的參考借鑒價(jià)值,需要的朋友參考下吧
    2024-01-01
  • Python使用argcomplete模塊實(shí)現(xiàn)自動(dòng)補(bǔ)全

    Python使用argcomplete模塊實(shí)現(xiàn)自動(dòng)補(bǔ)全

    argcomplete?是一個(gè)強(qiáng)大的Python庫(kù),可以大幅改善命令行應(yīng)用程序的用戶(hù)體驗(yàn),本文主要介紹了argcomplete模塊的相關(guān)用法,感興趣的小伙伴可以了解下
    2023-11-11
  • Python快速?gòu)囊曨l中提取視頻幀的方法詳解

    Python快速?gòu)囊曨l中提取視頻幀的方法詳解

    本文為大家介紹一種從視頻中抽取視頻幀的方法,由于單線(xiàn)程抽取視頻幀速度較慢,因此這里我們?cè)黾恿硕嗑€(xiàn)程的方法,感興趣的小伙伴可以動(dòng)手嘗試一下
    2022-07-07
  • Python函數(shù)用法和底層原理分析

    Python函數(shù)用法和底層原理分析

    函數(shù)是可重用的程序代碼塊。函數(shù)的作用,不僅可以實(shí)現(xiàn)代碼的復(fù)用,更能實(shí)現(xiàn)代碼的一致性。一致性指的是,只要修改函數(shù)的代碼,則所有調(diào)用該函數(shù)的地方都能得到體現(xiàn),這篇文章主要介紹了Python函數(shù)用法和底層分析,需要的朋友可以參考下
    2022-12-12
  • Python中列表索引 A[ : 2 ]與A[ : , 2]的區(qū)別說(shuō)明

    Python中列表索引 A[ : 2 ]與A[ : ,&nb

    這篇文章主要介紹了Python中列表索引 A[ : 2 ]與A[ : , 2]的區(qū)別說(shuō)明,具有很好的參考價(jià)值,希望對(duì)大家有所幫助。如有錯(cuò)誤或未考慮完全的地方,望不吝賜教
    2022-05-05
  • Python腳本利用adb進(jìn)行手機(jī)控制的方法

    Python腳本利用adb進(jìn)行手機(jī)控制的方法

    這篇文章主要介紹了Python腳本利用adb進(jìn)行手機(jī)控制的方法,文中通過(guò)示例代碼介紹的非常詳細(xì),對(duì)大家的學(xué)習(xí)或者工作具有一定的參考學(xué)習(xí)價(jià)值,需要的朋友們下面隨著小編來(lái)一起學(xué)習(xí)學(xué)習(xí)吧
    2019-07-07
  • numpy數(shù)組之讀寫(xiě)文件的實(shí)現(xiàn)

    numpy數(shù)組之讀寫(xiě)文件的實(shí)現(xiàn)

    本文主要介紹了numpy數(shù)組之讀寫(xiě)文件的實(shí)現(xiàn),文中通過(guò)示例代碼介紹的非常詳細(xì),對(duì)大家的學(xué)習(xí)或者工作具有一定的參考學(xué)習(xí)價(jià)值,需要的朋友們下面隨著小編來(lái)一起學(xué)習(xí)學(xué)習(xí)吧
    2023-02-02
  • Django集成CAS單點(diǎn)登錄的方法示例

    Django集成CAS單點(diǎn)登錄的方法示例

    這篇文章主要介紹了Django集成CAS單點(diǎn)登錄的方法示例,文中通過(guò)示例代碼介紹的非常詳細(xì),對(duì)大家的學(xué)習(xí)或者工作具有一定的參考學(xué)習(xí)價(jià)值,需要的朋友們下面隨著小編來(lái)一起學(xué)習(xí)學(xué)習(xí)吧
    2019-06-06
  • Python+decimal完成精度計(jì)算的示例詳解

    Python+decimal完成精度計(jì)算的示例詳解

    在進(jìn)行小數(shù)計(jì)算的時(shí)候使用float,經(jīng)常會(huì)出現(xiàn)小數(shù)位不精確的情況。在python編程中,推薦使用decimal來(lái)完成小數(shù)位的精度計(jì)算。本文將通過(guò)示例詳細(xì)說(shuō)說(shuō)decimal的使用,需要的可以參考一下
    2022-10-10

最新評(píng)論