欧美bbbwbbbw肥妇,免费乱码人妻系列日韩,一级黄片

Pytho爬蟲中Requests設(shè)置請求頭Headers的方法

 更新時間:2020年09月22日 10:57:06   作者:syblogs  
這篇文章主要介紹了Pytho爬蟲中Requests設(shè)置請求頭Headers的方法,文中通過示例代碼介紹的非常詳細,對大家的學(xué)習(xí)或者工作具有一定的參考學(xué)習(xí)價值,需要的朋友們下面隨著小編來一起學(xué)習(xí)學(xué)習(xí)吧

1、為什么要設(shè)置headers?

在請求網(wǎng)頁爬取的時候,輸出的text信息中會出現(xiàn)抱歉,無法訪問等字眼,這就是禁止爬取,需要通過反爬機制去解決這個問題。

headers是解決requests請求反爬的方法之一,相當(dāng)于我們進去這個網(wǎng)頁的服務(wù)器本身,假裝自己本身在爬取數(shù)據(jù)。

對反爬蟲網(wǎng)頁,可以設(shè)置一些headers信息,模擬成瀏覽器取訪問網(wǎng)站 。

2、 headers在哪里找?

谷歌或者火狐瀏覽器,在網(wǎng)頁面上點擊:右鍵–>檢查–>剩余按照圖中顯示操作,需要按Fn+F5刷新出網(wǎng)頁來

有的瀏覽器是點擊:右鍵->查看元素,刷新

注意:headers中有很多內(nèi)容,主要常用的就是user-agent 和 host,他們是以鍵對的形式展現(xiàn)出來,如果user-agent 以字典鍵對形式作為headers的內(nèi)容,就可以反爬成功,就不需要其他鍵對;否則,需要加入headers下的更多鍵對形式。

用Python下載一個網(wǎng)頁保存為本地的HTML文件實例1-中文網(wǎng)頁

import requests

# 中文網(wǎng)頁:https://baike.so.com/doc/24386561-25208408.html
url1='https://baike.so.com/doc/24386561-25208408.html'
#添加請求頭
headers = {
 'User-Agent':'Mozilla/5.0 (Windows NT 6.1; WOW64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/63.0.3239.132 Safari/537.36 QIHU 360SE'
}
response_1=requests.get(url1, headers=headers)

response_1.encoding='utf-8'
#第一種:
# with open('steve_jobs2.html','w',encoding='utf-8') as f1:
#  f1.write(response_1.text)
#第二種:
f1=open('steve_jobs2.html','w',encoding='utf-8')
f1.write(response_1.text)

c=response_1.text
print(c)

用Python下載一個網(wǎng)頁保存為本地的HTML文件實例2-英文網(wǎng)頁

import requests
import re

# 英文網(wǎng)頁:https://en.wikipedia.org/wiki/Steve_Jobs
url2='https://en.wikipedia.org/wiki/Steve_Jobs'
response_2=requests.get(url2)
# 源碼都是Utf-8編碼
response_2.encoding='utf-8'
#第一種:
# with open('steve_jobs3.html','w',encoding='utf-8') as f2:
#  f2.write(response_2.text)
#第二種:
f2=open('steve_jobs3.html','w',encoding='utf-8')
f2.write(response_2.text)

c=response_2.text
print(c)

到此這篇關(guān)于Pytho爬蟲中Requests設(shè)置請求頭Headers的方法的文章就介紹到這了,更多相關(guān)Pytho Requests設(shè)置請求頭Headers內(nèi)容請搜索腳本之家以前的文章或繼續(xù)瀏覽下面的相關(guān)文章希望大家以后多多支持腳本之家!

相關(guān)文章

  • Python實現(xiàn)購物車購物小程序

    Python實現(xiàn)購物車購物小程序

    這篇文章主要為大家詳細介紹了Python實現(xiàn)購物車購物小程序,文中示例代碼介紹的非常詳細,具有一定的參考價值,感興趣的小伙伴們可以參考一下
    2018-04-04
  • 跟老齊學(xué)Python之正規(guī)地說一句話

    跟老齊學(xué)Python之正規(guī)地說一句話

    雖然在第一部分中,已經(jīng)零星涉及到語句問題,并且在不同場合也進行了一些應(yīng)用。畢竟不那么系統(tǒng)。本部分,就比較系統(tǒng)地介紹python中的語句。
    2014-09-09
  • Windows下Anaconda下載安裝與配置教程分享

    Windows下Anaconda下載安裝與配置教程分享

    這篇文章主要介紹了Windows下Anaconda下載安裝與配置教程,具有很好的參考價值,希望對大家有所幫助。如有錯誤或未考慮完全的地方,望不吝賜教
    2022-12-12
  • 詳解Python的文件處理

    詳解Python的文件處理

    這篇文章主要為大家介紹了Python的文件處理,具有一定的參考價值,感興趣的小伙伴們可以參考一下,希望能夠給你帶來幫助
    2021-12-12
  • Flask模擬實現(xiàn)CSRF攻擊的方法

    Flask模擬實現(xiàn)CSRF攻擊的方法

    這篇文章主要介紹了Flask模擬實現(xiàn)CSRF攻擊的方法,小編覺得挺不錯的,現(xiàn)在分享給大家,也給大家做個參考。一起跟隨小編過來看看吧
    2018-07-07
  • Python判斷一個數(shù)是否為質(zhì)數(shù)的3種方法(超詳細)

    Python判斷一個數(shù)是否為質(zhì)數(shù)的3種方法(超詳細)

    一個大于1的自然數(shù),除了1和它本身外,不能被其他自然數(shù)(質(zhì)數(shù))整除(2, 3, 5, 7等),換句話說就是該數(shù)除了1和它本身以外不再有其他的因數(shù),下面這篇文章主要給大家介紹了關(guān)于利用Python判斷一個數(shù)是否為質(zhì)數(shù)的3種方法,需要的朋友可以參考下
    2024-09-09
  • Python數(shù)據(jù)庫格式化輸出文檔的思路與方法

    Python數(shù)據(jù)庫格式化輸出文檔的思路與方法

    這篇文章主要給大家介紹了關(guān)于Python數(shù)據(jù)庫格式化輸出文檔的思路與方法,文中通過示例代碼介紹的非常詳細,對大家的學(xué)習(xí)或者工作具有一定的參考學(xué)習(xí)價值,需要的朋友們下面隨著小編來一起學(xué)習(xí)學(xué)習(xí)吧
    2021-03-03
  • 詳解pyenv下使用python matplotlib模塊的問題解決

    詳解pyenv下使用python matplotlib模塊的問題解決

    這篇文章主要介紹了詳解pyenv下使用python matplotlib模塊的問題解決,非常具有實用價值,需要的朋友可以參考下
    2018-11-11
  • Python解決MySQL數(shù)據(jù)處理從SQL批量刪除報錯

    Python解決MySQL數(shù)據(jù)處理從SQL批量刪除報錯

    這篇文章主要為大家介紹了Python解決MySQL數(shù)據(jù)處理從SQL批量刪除報錯,有需要的朋友可以借鑒參考下,希望能夠有所幫助,祝大家多多進步,早日升職加薪
    2023-12-12
  • Python排序算法之插入排序及其優(yōu)化方案詳解

    Python排序算法之插入排序及其優(yōu)化方案詳解

    今天給大家?guī)淼奈恼率顷P(guān)于Python的相關(guān)知識,文章圍繞著Python插入排序及其優(yōu)化方案展開,文中有非常詳細的介紹及代碼示例,需要的朋友可以參考下
    2021-06-06

最新評論