python3 圖片referer防盜鏈的實現(xiàn)方法
本篇文章主要破解referer防盜鏈技術
referer防盜鏈技術:
referer防盜鏈技術是服務器通過檢查客戶端提起的請求包內(nèi)的referer字段來阻止圖片下載的,如果referer字段錯誤,服務器會跳到另一個地址,這將導致錯誤的圖片下載。
上面已經(jīng)了解到了referer防盜鏈技術,下面直接上代碼。
(我用的是python3,需要用到requests,html非系統(tǒng)包
下載方法:用python中的pip下載即可)
import urllib.request import requests import time import os import shutil from lxml import html def getPage(): ''''' 從網(wǎng)站首頁獲取妹子的網(wǎng)址 ''' fres=open('res.txt','w') htm=urllib.request.urlopen('http://www.mzitu.com/') out=htm.read() out=html.fromstring(out) urls=[] for res in out.xpath('//ul[@id="pins"]/li/a/@href'): urls.append(res) for r in urls: fres.write(r) fres.write('\n\r') fres.close() return urls def getPiclink(url): ''''' 獲取一個妹子的標題和她的所有圖片地址 ''' i_headers={'User-Agent':'Mozilla/5.0 (Windows NT 10.0; Win64; x64; rv:55.0) Gecko/20100101 Firefox/55.0'} sel=urllib.request.Request(url, headers=i_headers) #使用代理瀏覽器訪問網(wǎng)站 sel.add_header('Referer', 'http://www.mzitu.com/') #將referer字段添加到請求包里 sel=urllib.request.urlopen(sel).read() sel=html.fromstring(sel) total=sel.xpath('//div[@class="pagenavi"]/a[last()-1]/span/text()')[0] title=sel.xpath('//h2[@class="main-title"]/text()')[0] jpglist=[] for i in range(int(total)): link='{}/{}'.format(url, i+1) s=html.fromstring(urllib.request.urlopen(link).read()) jpg=s.xpath('//div[@class="main-image"]/p/a/img/@src')[0] jpglist.append(jpg) return title,jpglist def downloadJpg(title,piclist,link): ''''' 下載getPiclink()獲取到的妹子的圖片 ''' k=1 count=len(piclist) dirname=u"[%sP]%s" %(str(count),title) if os.path.exists(dirname): shutil.rmtree(dirname) os.mkdir(dirname) i_header={} i_header['Referer']=link #將getPiclink()獲取到的妹子的首頁網(wǎng)址作為referer字段的值 for i in piclist: filename='%s/%s/%s.jpg' %(os.path.abspath('.'),dirname, k) with open(filename,'wb') as jpg: jpg.write(requests.get(i, headers=i_header).content) #將referer字段添加到請求包里并下載圖片 time.sleep(0.5) k+=1 if __name__=='__main__': for link in getPage(): title,pic=getPiclink(link) downloadJpg(title,pic,link) print('OK!')
另外給大家推薦一個很好的抓包工具wireshark,我就是通過wirshark抓包分析后得到的referer信息。
以上就是本文的全部內(nèi)容,希望對大家的學習有所幫助,也希望大家多多支持腳本之家。
相關文章
Python實現(xiàn)變量數(shù)值交換及判斷數(shù)組是否含有某個元素的方法
這篇文章主要介紹了Python實現(xiàn)變量數(shù)值交換及判斷數(shù)組是否含有某個元素的方法,涉及Python字符串與數(shù)組的相關賦值、判斷操作技巧,需要的朋友可以參考下2017-09-09Python xml、字典、json、類四種數(shù)據(jù)類型如何實現(xiàn)互相轉換
這篇文章主要介紹了Python xml、字典、json、類四種數(shù)據(jù)類型如何實現(xiàn)互相轉換,文中通過示例代碼介紹的非常詳細,對大家的學習或者工作具有一定的參考學習價值,需要的朋友可以參考下2020-05-05使用Pandas的ExcelWriter操作excel的方法
這篇文章主要介紹了使用Pandas的ExcelWriter操作excel的方法,ExcelWriter這個插件有個坑,就是已經(jīng)設置好的格式是無法更改的,因此,由pandas轉成excel的時候,必須將格式清除,尤其是表頭的格式需要大家多多注意,本文結合示例代碼講解的非常詳細,需要的朋友參考下吧2023-11-11Pygame游戲開發(fā)之太空射擊實戰(zhàn)敵人精靈篇
相信大多數(shù)8090后都玩過太空射擊游戲,在過去游戲不多的年代太空射擊自然屬于經(jīng)典好玩的一款了,今天我們來自己動手實現(xiàn)它,在編寫學習中回顧過往展望未來,下面開始講解敵人精靈的使用2022-08-08Python如何爬取實時變化的WebSocket數(shù)據(jù)的方法
這篇文章主要介紹了Python如何爬取實時變化的WebSocket數(shù)據(jù)的方法,文中通過示例代碼介紹的非常詳細,對大家的學習或者工作具有一定的參考學習價值,需要的朋友們下面隨著小編來一起學習學習吧2019-03-03