快捷導(dǎo)航

使用requests庫(kù)制作Python爬蟲

更新時(shí)間：2018年03月25日 09:39:03 作者：豆芽菜橙

Requests是用python語言基于urllib編寫的，采用的是Apache2 Licensed開源協(xié)議的HTTP庫(kù),Requests它會(huì)比urllib更加方便，可以節(jié)約我們大量的工作。一句話，requests是python實(shí)現(xiàn)的最簡(jiǎn)單易用的HTTP庫(kù)，建議爬蟲使用requests庫(kù)。

使用python爬蟲其實(shí)就是方便，它會(huì)有各種工具類供你來使用，很方便。Java不可以嗎？也可以，使用httpclient工具、還有一個(gè)大神寫的webmagic框架，這些都可以實(shí)現(xiàn)爬蟲，只不過python集成工具庫(kù)，使用幾行爬取，而Java需要寫更多的行來實(shí)現(xiàn)，但目的都是一樣。

下面介紹requests庫(kù)簡(jiǎn)單使用：

#!/usr/local/env python
# coding:utf-8

import requests

#下面開始介紹requests的使用，環(huán)境語言是python3，使用下面的網(wǎng)址作為參考
#http://www.sse.com.cn/market/bonddata/data/tb/

request_param = {'jsonCallBack': 'jsonpCallback6588',
   'isPagination': 'true',
   'sqlId': 'COMMON_BOND_XXPL_ZQXX_L',
   'BONDTYPE': '地×××府債券',
   'pageHelp.pageSize': '25',
   'pageHelp.pageNo': '2',
   'pageHelp.beginPage': '2',
   'pageHelp.cacheSize': '1',
   'pageHelp.endPage': '21'}

user_agent = 'Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/65.0.3325.146 Safari/537.36'
referer = 'http://www.sse.com.cn/market/bonddata/data/ltb/'
#設(shè)置headers
headers = {'User-Agent': user_agent, 'Referer': referer}
#設(shè)置代理
proxy = {
 "http":"http://113.214.13.1:8000"
}

# 需要請(qǐng)求的URL地址
request_url = 'http://query.sse.com.cn/commonQuery.do?'

#設(shè)置請(qǐng)求地址
response = requests.get(request_url, headers=headers, proxies=proxy, params=request_param);
print(response.status_code)
#文本響應(yīng)內(nèi)容
print(response.text)
#json格式響應(yīng)內(nèi)容
print(response.json())
#二進(jìn)制響應(yīng)內(nèi)容
print(response.content)
#原始格式
print(response.raw)

您可能感興趣的文章:

相關(guān)文章

解決pytorch 交叉熵?fù)p失輸出為負(fù)數(shù)的問題
這篇文章主要介紹了解決pytorch 交叉熵?fù)p失輸出為負(fù)數(shù)的問題，具有很好的參考價(jià)值，希望對(duì)大家有所幫助。一起跟隨小編過來看看吧
2020-07-07
python列表數(shù)據(jù)增加和刪除的具體實(shí)例
在本篇文章里小編給大家整理的是一篇關(guān)于python列表數(shù)據(jù)增加和刪除的具體實(shí)例內(nèi)容，有興趣的朋友們可以學(xué)習(xí)下。
2021-05-05
python實(shí)現(xiàn)指定文件夾下的指定文件移動(dòng)到指定位置
這篇文章主要為大家詳細(xì)介紹了python實(shí)現(xiàn)指定文件夾下的指定文件移動(dòng)到指定位置，具有一定的參考價(jià)值，感興趣的小伙伴們可以參考一下
2018-09-09
11月編程語言排行榜 Python逆襲C#上升到第4
11月編程語言排行榜 Python逆襲C#上升到第4，無論在哪個(gè)榜單中 Python 都是保持著非同尋常的增長(zhǎng)速度，為什么Python增長(zhǎng)的這么快
2017-11-11
pandas.DataFrame刪除/選取含有特定數(shù)值的行或列實(shí)例
今天小編就為大家分享一篇pandas.DataFrame刪除/選取含有特定數(shù)值的行或列實(shí)例，具有很好的參考價(jià)值，希望對(duì)大家有所幫助。一起跟隨小編過來看看吧
2018-11-11
Django項(xiàng)目如何配置Memcached和Redis緩存?選擇哪個(gè)更有優(yōu)勢(shì)?
這篇文章主要介紹了Django項(xiàng)目如何配置Memcached和Redis緩存，幫助大家更好的理解和學(xué)習(xí)使用django框架，感興趣的朋友可以了解下
2021-04-04
Python數(shù)據(jù)類型之String字符串實(shí)例詳解
這篇文章主要介紹了Python數(shù)據(jù)類型之String字符串,結(jié)合實(shí)例形式詳細(xì)講解了Python字符串的概念、定義、連接、格式化、轉(zhuǎn)換、查找、截取、判斷等常見操作技巧,需要的朋友可以參考下
2019-05-05
基于python使用OpenCV進(jìn)行物體輪廓排序
這篇文章主要介紹了基于python使用OpenCV進(jìn)行物體輪廓排序，在進(jìn)行圖像處理過程中,我們經(jīng)常會(huì)遇到一些和物體輪廓相關(guān)的操作，我們直接使用Opencv的findContours函數(shù)可以很容易的得到每個(gè)目標(biāo)的輪廓,但是可視化后,?這個(gè)次序是無序的，更多相關(guān)資料請(qǐng)參考下面文章內(nèi)容
2022-01-01
pycharm中l(wèi)eetcode插件使用圖文詳解
這篇文章主要介紹了pycharm中l(wèi)eetcode插件使用圖文詳解,本文分步驟給大家介紹的非常詳細(xì)，對(duì)大家的學(xué)習(xí)或工作具有一定的參考借鑒價(jià)值，需要的朋友可以參考下
2020-12-12
OpenCV 圖像繪制的實(shí)現(xiàn)
本文主要介紹了OpenCV 圖像繪制的實(shí)現(xiàn)，主要包括直線，圓，多邊形和自定義圖形等，具有一定的參考價(jià)值，感興趣的可以了解一下
2021-07-07