使用requests庫(kù)制作Python爬蟲
使用python爬蟲其實(shí)就是方便,它會(huì)有各種工具類供你來使用,很方便。Java不可以嗎?也可以,使用httpclient工具、還有一個(gè)大神寫的webmagic框架,這些都可以實(shí)現(xiàn)爬蟲,只不過python集成工具庫(kù),使用幾行爬取,而Java需要寫更多的行來實(shí)現(xiàn),但目的都是一樣。
下面介紹requests庫(kù)簡(jiǎn)單使用:
#!/usr/local/env python
# coding:utf-8
import requests
#下面開始介紹requests的使用,環(huán)境語言是python3,使用下面的網(wǎng)址作為參考
#http://www.sse.com.cn/market/bonddata/data/tb/
request_param = {'jsonCallBack': 'jsonpCallback6588',
'isPagination': 'true',
'sqlId': 'COMMON_BOND_XXPL_ZQXX_L',
'BONDTYPE': '地×××府債券',
'pageHelp.pageSize': '25',
'pageHelp.pageNo': '2',
'pageHelp.beginPage': '2',
'pageHelp.cacheSize': '1',
'pageHelp.endPage': '21'}
user_agent = 'Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/65.0.3325.146 Safari/537.36'
referer = 'http://www.sse.com.cn/market/bonddata/data/ltb/'
#設(shè)置headers
headers = {'User-Agent': user_agent, 'Referer': referer}
#設(shè)置代理
proxy = {
"http":"http://113.214.13.1:8000"
}
# 需要請(qǐng)求的URL地址
request_url = 'http://query.sse.com.cn/commonQuery.do?'
#設(shè)置請(qǐng)求地址
response = requests.get(request_url, headers=headers, proxies=proxy, params=request_param);
print(response.status_code)
#文本響應(yīng)內(nèi)容
print(response.text)
#json格式響應(yīng)內(nèi)容
print(response.json())
#二進(jìn)制響應(yīng)內(nèi)容
print(response.content)
#原始格式
print(response.raw)
相關(guān)文章
解決pytorch 交叉熵?fù)p失輸出為負(fù)數(shù)的問題
這篇文章主要介紹了解決pytorch 交叉熵?fù)p失輸出為負(fù)數(shù)的問題,具有很好的參考價(jià)值,希望對(duì)大家有所幫助。一起跟隨小編過來看看吧2020-07-07
python列表數(shù)據(jù)增加和刪除的具體實(shí)例
在本篇文章里小編給大家整理的是一篇關(guān)于python列表數(shù)據(jù)增加和刪除的具體實(shí)例內(nèi)容,有興趣的朋友們可以學(xué)習(xí)下。2021-05-05
python實(shí)現(xiàn)指定文件夾下的指定文件移動(dòng)到指定位置
這篇文章主要為大家詳細(xì)介紹了python實(shí)現(xiàn)指定文件夾下的指定文件移動(dòng)到指定位置,具有一定的參考價(jià)值,感興趣的小伙伴們可以參考一下2018-09-09
pandas.DataFrame刪除/選取含有特定數(shù)值的行或列實(shí)例
今天小編就為大家分享一篇pandas.DataFrame刪除/選取含有特定數(shù)值的行或列實(shí)例,具有很好的參考價(jià)值,希望對(duì)大家有所幫助。一起跟隨小編過來看看吧2018-11-11
Django項(xiàng)目如何配置Memcached和Redis緩存?選擇哪個(gè)更有優(yōu)勢(shì)?
這篇文章主要介紹了Django項(xiàng)目如何配置Memcached和Redis緩存,幫助大家更好的理解和學(xué)習(xí)使用django框架,感興趣的朋友可以了解下2021-04-04
Python數(shù)據(jù)類型之String字符串實(shí)例詳解
這篇文章主要介紹了Python數(shù)據(jù)類型之String字符串,結(jié)合實(shí)例形式詳細(xì)講解了Python字符串的概念、定義、連接、格式化、轉(zhuǎn)換、查找、截取、判斷等常見操作技巧,需要的朋友可以參考下2019-05-05

