Python爬蟲scrapy框架Cookie池(微博Cookie池)的使用

更新時間：2021年01月13日 09:46:53 作者：MXuDong

這篇文章主要介紹了Python爬蟲scrapy框架Cookie池(微博Cookie池)的使用,文中通過示例代碼介紹的非常詳細，對大家的學習或者工作具有一定的參考學習價值，需要的朋友們下面隨著小編來一起學習學習吧

下載代碼Cookie池（這里主要是微博登錄，也可以自己配置置其他的站點網(wǎng)址）

下載代碼GitHub：https://github.com/Python3WebSpider/CookiesPool

下載安裝過后注意看網(wǎng)頁下面的相關(guān)基礎(chǔ)配置和操作！！?。。。。。。。。。。?/strong>

自己的設置主要有下面幾步：

1、配置其他設置

2、設置使用的瀏覽器

3、設置模擬登陸

源碼cookies.py的修改（以下兩處不修改可能會產(chǎn)生bug）：

4、獲取cookie

隨機獲取Cookies： http://localhost:5000/weibo/random（注意：cookie使用時是需要后期處理的?。。?/strong>

簡單的處理方式，如下代碼（偶爾需要對獲取的cookie處理）：

def get_cookie(self): return requests.get('http://127.0.0.1:5000/weibo/random').text def stringToDict(self,cookie): itemDict = {} items = cookie.replace(':', '=').split(',') for item in items: key = item.split('=')[0].replace(' ', '').strip(' "') value = item.split('=')[1].strip(' "') itemDict[key] = value return itemDict

scrapy爬蟲的使用示例（爬取微博）：

middlewares.py中自定義請求中間件

def start_requests(self): ua = UserAgent() headers = { 'User-Agent': ua.random, } cookies = self.stringToDict(str(self.get_cookie().strip('{|}'))) yield scrapy.Request(url=self.start_urls[0], headers=headers, cookies=cookies, callback=self.parse) cookies = self.stringToDict(str(self.get_cookie().strip('{|}'))) yield scrapy.Request(url=self.start_urls[0], headers=headers, cookies=cookies, callback=self.parse)

settings.py 中的配置：

5、錄入賬號和密碼：

格式規(guī)定（賬號----密碼）

6、驗證：（注意：使用cmd）

7、使用時注意保持cmd打開運行?。?/p>
使用時一定要打開cmd,并運行如第6步。

得到Cookie是判斷是否處理處理Cookie（幾乎都需要！?。╊惐鹊?步！??！

到此這篇關(guān)于Python爬蟲scrapy框架Cookie池(微博Cookie池)的使用的文章就介紹到這了,更多相關(guān)scrapy Cookie池內(nèi)容請搜索腳本之家以前的文章或繼續(xù)瀏覽下面的相關(guān)文章希望大家以后多多支持腳本之家！

您可能感興趣的文章:
Python爬蟲使用瀏覽器cookies：browsercookie過程解析
cookies應對python反爬蟲知識點詳解
Python爬蟲利用cookie實現(xiàn)模擬登陸實例詳解
python實戰(zhàn)scrapy操作cookie爬取博客涉及browsercookie

scrapy

Cookie

相關(guān)文章

python機器學習之KNN分類算法
這篇文章主要為大家詳細介紹了python機器學習之KNN分類算法，具有一定的參考價值，感興趣的小伙伴們可以參考一下
2018-08-08

Python實現(xiàn)簡單的猜單詞小游戲
這篇文章主要為大家詳細介紹了Python實現(xiàn)簡單的猜單詞小游戲，文中示例代碼介紹的非常詳細，具有一定的參考價值，感興趣的小伙伴們可以參考一下
2020-10-10

Python統(tǒng)計序列和文件中元素的頻度
這篇文章主要介紹了Python統(tǒng)計序列和文件中元素的頻度，文章基于python的相關(guān)資料展開詳細的內(nèi)容介紹，具有一定的參考價值需要的小伙伴可以參考一下
2022-04-04

從0到1使用python開發(fā)一個半自動答題小程序的實現(xiàn)
這篇文章主要介紹了從0到1使用python開發(fā)一個半自動答題小程序的實現(xiàn)，文中通過示例代碼介紹的非常詳細，對大家的學習或者工作具有一定的參考學習價值，需要的朋友們下面隨著小編來一起學習學習吧
2020-05-05

Python3用tkinter和PIL實現(xiàn)看圖工具
這篇文章給大家分享了Python3用tkinter和PIL實現(xiàn)看圖工具的詳細實例代碼，有興趣的朋友參考學習下。
2018-06-06

分享python中matplotlib指定繪圖顏色的八種方式
這篇文章主要給大家分享的是python中matplotlib指定繪圖顏色的八種方式，在使用matplotlib的pyplot庫進行繪圖時，經(jīng)常會發(fā)現(xiàn)各種開源代碼指定“color”的方式并不一致，下面就向大家展示8種指定color的方式,需要的朋友可以參考一下
2022-03-03

使用Python的time庫格式化時間的方法
通過使用Python的time庫,我們可以方便地進行時間處理、格式化、解析和計算等操作,本文介紹了time庫的一些常見功能和使用方法,包括格式化時間、解析時間戳、獲取當前時間、計算時間差等,感興趣的朋友一起看看吧
2023-11-11

python繪制箱型圖
這篇文章主要為大家詳細介紹了python繪制箱型圖，文中示例代碼介紹的非常詳細，具有一定的參考價值，感興趣的小伙伴們可以參考一下
2021-04-04

Python中識別圖片/滑塊驗證碼準確率極高的ddddocr庫詳解
驗證碼的種類有很多，它是常用的一種反爬手段，包括：圖片驗證碼，滑塊驗證碼，等一些常見的驗證碼場景。這里推薦一個簡單實用的識別驗證碼的庫?ddddocr?(帶帶弟弟ocr)庫，希望大家喜歡
2023-02-02

淺談Python的垃圾回收機制
本文雖然是轉(zhuǎn)載的，但是是真的好的一篇非常透徹的對Python垃圾回收機制的講解!!!這里推薦給大家
2016-12-12

最新評論

大家感興趣的內(nèi)容

1Python入門教程超詳細1小時學會Python
2Pycharm?2020最新永久激活碼（附最新激活碼和插件
3Python 元組(Tuple)操作詳解
4Python 列表(List)操作方法詳解
5Python 字典(Dictionary)操作詳解
6Pycharm 2020年最新激活碼（親測有效）
7python strip()函數(shù) 介紹
8pycharm 使用心得（一）安裝和首次使用
9python中使用xlrd、xlwt操作excel表格詳解
10python 中文亂碼問題深入分析

最近更新的內(nèi)容

Python re.findall中正則表達式(.*?)和參數(shù)re
python中的flask框架Jinja?模板入門教程
在python win系統(tǒng)下打開TXT文件的實例
詳解10個可以快速用Python進行數(shù)據(jù)分析的小技巧
python matplotlib 畫dataframe的時間序列圖實例
python實現(xiàn)ping命令小程序
簡單了解python裝飾器原理及使用方法
django admin 根據(jù)choice字段選擇的不同來顯示不同的頁面方式
Python字典dict常用內(nèi)置函數(shù)詳解
Python的文本常量與字符串模板之string庫

常用在線小工具

欧美bbbwbbbw肥妇,免费乱码人妻系列日韩,一级黄片

Python爬蟲scrapy框架Cookie池(微博Cookie池)的使用

自己的設置主要有下面幾步：

相關(guān)文章

最新評論

大家感興趣的內(nèi)容

最近更新的內(nèi)容

常用在線小工具