Scrapy框架實(shí)現(xiàn)的登錄網(wǎng)站操作示例
本文實(shí)例講述了Scrapy框架實(shí)現(xiàn)的登錄網(wǎng)站操作。分享給大家供大家參考,具體如下:
一、使用cookies登錄網(wǎng)站
import scrapy class LoginSpider(scrapy.Spider): name = 'login' allowed_domains = ['xxx.com'] start_urls = ['https://www.xxx.com/xx/'] cookies = "" def start_requests(self): for url in self.start_urls: yield scrapy.Request(url, cookies=self.cookies, callback=self.parse) def parse(self, response): with open("01login.html", "wb") as f: f.write(response.body)
二、發(fā)送post請(qǐng)求登錄, 要手動(dòng)解析網(wǎng)頁(yè)獲取登錄參數(shù)
import scrapy class LoginSpider(scrapy.Spider): name='login_code' allowed_domains = ['xxx.com'] #1. 登錄頁(yè)面 start_urls = ['https://www.xxx.com/login/'] def parse(self, response): #2. 代碼登錄 login_url='https://www.xxx.com/login' formdata={ "username":"xxx", "pwd":"xxx", "formhash":response.xpath("http://input[@id='formhash']/@value").extract_first(), "backurl":response.xpath("http://input[@id='backurl']/@value").extract_first() } #3. 發(fā)送登錄請(qǐng)求post yield scrapy.FormRequest(login_url, formdata=formdata, callback=self.parse_login) def parse_login(self, response): #4.訪問(wèn)目標(biāo)頁(yè)面 member_url="https://www.xxx.com/member" yield scrapy.Request(member_url, callback=self.parse_member) def parse_member(self, response): with open("02login.html",'wb') as f: f.write(response.body)
三、發(fā)送post請(qǐng)求登錄, 自動(dòng)解析網(wǎng)頁(yè)獲取登錄參數(shù)
import scrapy class LoginSpider(scrapy.Spider): name='login_code2' allowed_domains = ['xxx.com'] #1. 登錄頁(yè)面 start_urls = ['https://www.xxx.com/login/'] def parse(self, response): #2. 代碼登錄 login_url='https://www.xxx.com/login' formdata={ "username":"xxx", "pwd":"xxx" } #3. 發(fā)送登錄請(qǐng)求post yield scrapy.FormRequest.from_response( response, formxpath="http://*[@id='login_pc']", formdata=formdata, method="POST", #覆蓋之前的get請(qǐng)求 callback=self.parse_login ) def parse_login(self, response): #4.訪問(wèn)目標(biāo)頁(yè)面 member_url="https://www.xxx.com/member" yield scrapy.Request(member_url, callback=self.parse_member) def parse_member(self, response): with open("03login.html",'wb') as f: f.write(response.body)
更多相關(guān)內(nèi)容可查看本站專(zhuān)題:《Python Socket編程技巧總結(jié)》、《Python正則表達(dá)式用法總結(jié)》、《Python數(shù)據(jù)結(jié)構(gòu)與算法教程》、《Python函數(shù)使用技巧總結(jié)》、《Python字符串操作技巧匯總》、《Python入門(mén)與進(jìn)階經(jīng)典教程》及《Python文件與目錄操作技巧匯總》
希望本文所述對(duì)大家基于Scrapy框架的Python程序設(shè)計(jì)有所幫助。
相關(guān)文章
Python面向?qū)ο蟮娜筇匦苑庋b、繼承、多態(tài)
這篇文章介紹了Python面向?qū)ο蟮娜筇匦苑庋b、繼承、多態(tài),對(duì)大家的學(xué)習(xí)或者工作具有一定的參考學(xué)習(xí)價(jià)值,需要的朋友們下面隨著小編來(lái)一起學(xué)習(xí)學(xué)習(xí)吧2022-07-07Pycharm github配置實(shí)現(xiàn)過(guò)程圖解
這篇文章主要介紹了Pycharm github配置實(shí)現(xiàn)過(guò)程圖解,文中通過(guò)示例代碼介紹的非常詳細(xì),對(duì)大家的學(xué)習(xí)或者工作具有一定的參考學(xué)習(xí)價(jià)值,需要的朋友可以參考下2020-10-10python中快速進(jìn)行多個(gè)字符替換的方法小結(jié)
最近在用python給自己的seo工作提高效率和節(jié)省時(shí)間,發(fā)現(xiàn)python真的很不錯(cuò),可以完成很多事情。多個(gè)字符替換是大家可能都會(huì)遇到的一個(gè)問(wèn)題,昨天在工作中就碰到了這么一個(gè)問(wèn)題,所以想著記錄一下解決方案及其過(guò)程,方便以后參考。下面來(lái)一起看看吧。2016-12-12python操作SqlServer獲取特定表的所有列名(推薦)
這篇文章主要介紹了python操作SqlServer獲取特定表的所有列名,本文通過(guò)實(shí)例代碼給大家介紹的非常詳細(xì),對(duì)大家的學(xué)習(xí)或工作具有一定的參考借鑒價(jià)值,需要的朋友可以參考下2022-08-08Django命名URL和反向解析URL實(shí)現(xiàn)解析
這篇文章主要介紹了Django命名URL和反向解析URL實(shí)現(xiàn)解析,文中通過(guò)示例代碼介紹的非常詳細(xì),對(duì)大家的學(xué)習(xí)或者工作具有一定的參考學(xué)習(xí)價(jià)值,需要的朋友可以參考下2019-08-08python多項(xiàng)式擬合之np.polyfit 和 np.polyld詳解
這篇文章主要介紹了python多項(xiàng)式擬合之np.polyfit 和 np.polyld的實(shí)例代碼,python數(shù)據(jù)擬合主要可采用numpy庫(kù),庫(kù)的安裝可直接用pip install numpy等,需要的朋友跟隨小編一起學(xué)習(xí)吧2020-02-02Tensorflow與Keras自適應(yīng)使用顯存方式
這篇文章主要介紹了Tensorflow與Keras自適應(yīng)使用顯存方式,具有很好的參考價(jià)值,希望對(duì)大家有所幫助。一起跟隨小編過(guò)來(lái)看看吧2020-06-06Python中利用Scipy包的SIFT方法進(jìn)行圖片識(shí)別的實(shí)例教程
SIFT算法可以檢測(cè)圖片中的局部特征,算法原理相當(dāng)復(fù)雜...但是!Python強(qiáng)大的第三方包Scipy中帶有實(shí)現(xiàn)SIFT算法的SIFT方法,我們只要拿來(lái)用就可以了,下面就為大家?guī)?lái)Python中利用Scipy包的SIFT方法進(jìn)行圖片識(shí)別的實(shí)例教程.2016-06-06python數(shù)學(xué)建模是加深Numpy和Pandas學(xué)習(xí)
這篇文章主要介紹了python數(shù)學(xué)建模是加深Numpy和Pandas學(xué)習(xí),緊接上一篇學(xué)習(xí)內(nèi)容展開(kāi)Numpy更多相關(guān)內(nèi)容,需要的小伙伴可以參考一下2022-07-07