欧美bbbwbbbw肥妇,免费乱码人妻系列日韩,一级黄片

Python爬蟲(chóng)之requests基礎(chǔ)用法詳解

 更新時(shí)間:2023年10月23日 10:36:20   作者:ZhiHuaWei  
這篇文章主要介紹了Python爬蟲(chóng)之requests基礎(chǔ)用法詳解,雖然Python的標(biāo)準(zhǔn)庫(kù)中urllib模塊已經(jīng)包含了平常我們使用的大多數(shù)功能,但是它的API使用起來(lái)讓人感覺(jué)不太友好,而requests庫(kù)使用更簡(jiǎn)潔方便,需要的朋友可以參考下

requests庫(kù)介紹

雖然Python的標(biāo)準(zhǔn)庫(kù)中urllib模塊已經(jīng)包含了平常我們使用的大多數(shù)功能,但是它的API使用起來(lái)讓人感覺(jué)不太友好,而requests庫(kù)宣傳是“HTTP for Human”,說(shuō)明使用更簡(jiǎn)潔方便。由于requests庫(kù)不是標(biāo)準(zhǔn)庫(kù),所以我們首先需要安裝這個(gè)requests庫(kù)。

requests的安裝和文檔地址

利用 pip 命令可以非常方便您的安裝:

    pip install requests

中文文檔:https://2.python-requests.org//zh_CN/latest/index.html

發(fā)送get請(qǐng)求

發(fā)送GET請(qǐng)求,直接調(diào)用requests.get()就可以了,想要發(fā)送什么類(lèi)型的請(qǐng)求,就調(diào)用什么方法。

代碼示例:

    # 引入requests庫(kù)
    import requests
    
    # 向指定的url發(fā)送請(qǐng)求,并返回
    url = 'https://www.baidu.com/'
    # 發(fā)送get請(qǐng)求
    req = requests.get(url=url)
    # 響應(yīng)內(nèi)容
    print('狀態(tài)碼:', req.status_code)
    print('請(qǐng)求地址:', req.url)
    print('當(dāng)前編碼:', req.encoding)
    # req.encoding = 'utf-8'  # 設(shè)置編碼
    # 以encoding解析返回內(nèi)容。字符串方式的響應(yīng)體,會(huì)自動(dòng)根據(jù)響應(yīng)頭部的字符編碼進(jìn)行解碼
    print('內(nèi)容1:', req.text)
    # 以字節(jié)形式(二進(jìn)制)返回。字節(jié)方式的響應(yīng)體,會(huì)自動(dòng)為你解碼 gzip 和deflate 壓縮。
    print('內(nèi)容2:', req.content)
    # print('內(nèi)容2:', req.content.decode())
    # 以字典對(duì)象存儲(chǔ)服務(wù)器響應(yīng)頭,但是這個(gè)字典比較特殊,字典鍵不區(qū)分大小寫(xiě),若鍵不存在則返回None
    print('headers:', req.headers)
    # 返回原始響應(yīng)體,也就是 urllib 的 response 對(duì)象,使用 使用 r.raw.read()
    print('原始響應(yīng)體:', req.raw)
    # print(req.raw.read())

發(fā)送post請(qǐng)求

發(fā)送POST請(qǐng)求也是非常簡(jiǎn)單,直接調(diào)用requests.post()就可以了;如果返回的是json數(shù)據(jù),那么可以使用response.json()來(lái)將json字符串轉(zhuǎn)換為字典或者列表。

代碼示例:

    # 引入requests庫(kù)
    import requests
    
    # 聲明定義請(qǐng)求頭
    headers = {
        'User-Agent': 'Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/70.0.3538.110 Safari/537.36',
    }
    # 請(qǐng)求地址
    post_url = 'https://fanyi.baidu.com/sug'
    # 參數(shù)
    form_data = {
        'kw': 'honey'
    }
    # 進(jìn)行post請(qǐng)求
    req = requests.post(url=post_url, data=form_data, headers=headers)
    # 響應(yīng)內(nèi)容
    print('狀態(tài)碼:', req.status_code)
    print('請(qǐng)求地址:', req.url)
    print('當(dāng)前編碼:', req.encoding)
    # req.encoding = 'utf-8'  # 設(shè)置編碼
    # 以encoding解析返回內(nèi)容。字符串方式的響應(yīng)體,會(huì)自動(dòng)根據(jù)響應(yīng)頭部的字符編碼進(jìn)行解碼
    print('內(nèi)容1:', req.text)
    # 以字節(jié)形式(二進(jìn)制)返回。字節(jié)方式的響應(yīng)體,會(huì)自動(dòng)為你解碼 gzip 和deflate 壓縮。
    print('內(nèi)容2:', req.content)
    # print('內(nèi)容2:', req.content.decode())
    # 以字典對(duì)象存儲(chǔ)服務(wù)器響應(yīng)頭,但是這個(gè)字典比較特殊,字典鍵不區(qū)分大小寫(xiě),若鍵不存在則返回None
    print('headers:', req.headers)
    # 返回原始響應(yīng)體,也就是 urllib 的 response 對(duì)象,使用 使用 r.raw.read()
    print('原始響應(yīng)體:', req.raw)
    # print(req.raw.read())
    # 返回json對(duì)象
    print('json:', req.json())

requests異常處理

我們?cè)趯?shí)際使用過(guò)程中,可能會(huì)遇到網(wǎng)絡(luò)的各種變化會(huì)導(dǎo)致請(qǐng)求過(guò)程發(fā)生各種未知的錯(cuò)誤導(dǎo)致程序中斷,這就使我們的程序不能很好的去處理錯(cuò)誤。所以為了使我們的程序在請(qǐng)求時(shí)遇到錯(cuò)誤,可以捕獲這種錯(cuò)誤,就要用到try…except方法,以及了解requests可能發(fā)生的各種錯(cuò)誤。

    import requests

    url = 'http://www.b.com'
    try:
        req = requests.get(url=url)
        print(req.text)
    except requests.exceptions.ConnectionError as e:
        print(e)
    except requests.exceptions.ChunkedEncodingError as e:
        print(e)
    except requests.exceptions.HTTPError as e:
        print(e)

response的一些屬性

上面的代碼例子中已經(jīng)有說(shuō)明,在此再列舉一遍。

    # 響應(yīng)內(nèi)容
    print('狀態(tài)碼:', req.status_code)
    print('請(qǐng)求地址:', req.url)
    print('當(dāng)前編碼:', req.encoding)
    # req.encoding = 'utf-8'  # 設(shè)置編碼
    # 以encoding解析返回內(nèi)容。字符串方式的響應(yīng)體,會(huì)自動(dòng)根據(jù)響應(yīng)頭部的字符編碼進(jìn)行解碼
    print('內(nèi)容1:', req.text)
    # 以字節(jié)形式(二進(jìn)制)返回。字節(jié)方式的響應(yīng)體,會(huì)自動(dòng)為你解碼 gzip 和deflate 壓縮。
    print('內(nèi)容2:', req.content)
    # print('內(nèi)容2:', req.content.decode())
    # 以字典對(duì)象存儲(chǔ)服務(wù)器響應(yīng)頭,但是這個(gè)字典比較特殊,字典鍵不區(qū)分大小寫(xiě),若鍵不存在則返回None
    print('headers:', req.headers)
    # 返回原始響應(yīng)體,也就是 urllib 的 response 對(duì)象,使用 使用 r.raw.read()
    print('原始響應(yīng)體:', req.raw)
    # print(req.raw.read())
    # 獲取返回的json數(shù)據(jù)
    print('json:', req.json())
  • response.content:這個(gè)是直接從網(wǎng)絡(luò)上面抓取的數(shù)據(jù),沒(méi)有經(jīng)過(guò)任何解碼,所以是一個(gè)butes類(lèi)型,其實(shí)在硬盤(pán)上和網(wǎng)絡(luò)上傳輸?shù)淖址际莃ytes類(lèi)型。
  • response.text:這個(gè)是string的數(shù)據(jù)類(lèi)型,是requests庫(kù)將response.content進(jìn)行解碼的字符串,解碼需要指定一個(gè)編碼方式,requests回根據(jù)自己的請(qǐng)求來(lái)判斷解碼方式,所以有時(shí)候可能會(huì)由于解碼方式不同產(chǎn)生亂碼,這時(shí)候就應(yīng)該使用response.content.decode('utf-8')繼續(xù)手動(dòng)解碼。

到此這篇關(guān)于Python爬蟲(chóng)之requests基礎(chǔ)用法詳解的文章就介紹到這了,更多相關(guān)Python的requests基礎(chǔ)用法內(nèi)容請(qǐng)搜索腳本之家以前的文章或繼續(xù)瀏覽下面的相關(guān)文章希望大家以后多多支持腳本之家!

相關(guān)文章

  • 教你用Python pygame設(shè)置窗口標(biāo)題和圖標(biāo)

    教你用Python pygame設(shè)置窗口標(biāo)題和圖標(biāo)

    今天給大家?guī)?lái)的是關(guān)于Python的相關(guān)知識(shí),文章圍繞著用Python pygame設(shè)置窗口標(biāo)題和圖標(biāo)展開(kāi),文中有非常詳細(xì)的介紹及代碼示例,需要的朋友可以參考下
    2021-06-06
  • PyG搭建GCN模型實(shí)現(xiàn)節(jié)點(diǎn)分類(lèi)GCNConv參數(shù)詳解

    PyG搭建GCN模型實(shí)現(xiàn)節(jié)點(diǎn)分類(lèi)GCNConv參數(shù)詳解

    這篇文章主要為大家介紹了PyG搭建GCN模型實(shí)現(xiàn)節(jié)點(diǎn)分類(lèi)GCNConv參數(shù)詳解,有需要的朋友可以借鑒參考下,希望能夠有所幫助,祝大家多多進(jìn)步,早日升職加薪
    2022-05-05
  • Python文件與文件夾常見(jiàn)基本操作總結(jié)

    Python文件與文件夾常見(jiàn)基本操作總結(jié)

    這篇文章主要介紹了Python文件與文件夾常見(jiàn)基本操作,結(jié)合實(shí)例形式總結(jié)分析了Python針對(duì)文件與文件夾操作所涉及的常見(jiàn)函數(shù)與方法的使用技巧,需要的朋友可以參考下
    2016-09-09
  • Python檢查判斷一個(gè)數(shù)是不是另一個(gè)數(shù)的整數(shù)次冪實(shí)例深究

    Python檢查判斷一個(gè)數(shù)是不是另一個(gè)數(shù)的整數(shù)次冪實(shí)例深究

    在數(shù)學(xué)和計(jì)算中,確定一個(gè)數(shù)是否為另一個(gè)數(shù)的整數(shù)次冪是一個(gè)常見(jiàn)而重要的問(wèn)題,例如,我們可能需要判斷一個(gè)數(shù)是否是某個(gè)數(shù)的平方、立方或其他冪次,本文將探討在Python中如何實(shí)現(xiàn)這一功能,通過(guò)數(shù)學(xué)方法和算法檢查一個(gè)數(shù)是否是另一個(gè)數(shù)的整數(shù)次冪
    2023-12-12
  • pytest插件的7種用法

    pytest插件的7種用法

    本文主要介紹了pytest插件的7種用法,文中通過(guò)示例代碼介紹的非常詳細(xì),對(duì)大家的學(xué)習(xí)或者工作具有一定的參考學(xué)習(xí)價(jià)值,需要的朋友們下面隨著小編來(lái)一起學(xué)習(xí)學(xué)習(xí)吧
    2023-02-02
  • python包實(shí)現(xiàn)?retrying?重復(fù)回調(diào)操作

    python包實(shí)現(xiàn)?retrying?重復(fù)回調(diào)操作

    這篇文章主要介紹了python包實(shí)現(xiàn)?retrying?重復(fù)回調(diào)操作,文章python的相關(guān)資料展開(kāi)對(duì)retrying?重復(fù)回調(diào)的詳細(xì)介紹,需要的小伙伴可以參考一下,希望對(duì)你的學(xué)習(xí)有所幫助
    2022-04-04
  • Python?Enum枚舉類(lèi)的定義及使用場(chǎng)景最佳實(shí)踐

    Python?Enum枚舉類(lèi)的定義及使用場(chǎng)景最佳實(shí)踐

    枚舉(Enum)是一種有助于提高代碼可讀性和可維護(hù)性的數(shù)據(jù)類(lèi)型,允許我們?yōu)橐唤M相關(guān)的常量賦予有意義的名字,在Python中,枚舉類(lèi)(Enum)提供了一種簡(jiǎn)潔而強(qiáng)大的方式來(lái)定義和使用枚舉
    2023-11-11
  • python安裝twisted的問(wèn)題解析

    python安裝twisted的問(wèn)題解析

    我們?cè)谶@篇文章中給大家詳細(xì)整理了python安裝twisted時(shí)遇到的問(wèn)題以及解決方法,有需要的朋友們參考下。
    2018-08-08
  • 淺談django框架集成swagger以及自定義參數(shù)問(wèn)題

    淺談django框架集成swagger以及自定義參數(shù)問(wèn)題

    這篇文章主要介紹了淺談django框架集成swagger以及自定義參數(shù)問(wèn)題,具有很好的參考價(jià)值,希望對(duì)大家有所幫助。一起跟隨小編過(guò)來(lái)看看吧
    2020-07-07
  • Pycharm配置遠(yuǎn)程調(diào)試的方法步驟

    Pycharm配置遠(yuǎn)程調(diào)試的方法步驟

    這篇文章主要介紹了Pycharm配置遠(yuǎn)程調(diào)試的方法步驟,小編覺(jué)得挺不錯(cuò)的,現(xiàn)在分享給大家,也給大家做個(gè)參考。一起跟隨小編過(guò)來(lái)看看吧
    2018-12-12

最新評(píng)論