python實(shí)現(xiàn)愛奇藝登陸密碼RSA加密的方法示例詳解
前言
通過Python實(shí)現(xiàn)對(duì)大麥網(wǎng)近期全國(guó)演唱會(huì)數(shù)據(jù)進(jìn)行爬取,通過分析,我們發(fā)現(xiàn)大麥網(wǎng)屬于Python爬蟲策略中“中等型”難度網(wǎng)站,演唱會(huì)數(shù)據(jù)封裝在json文件中。因此,我們簡(jiǎn)單的通過requests、json就可以將數(shù)據(jù)爬取出來,后期通過pandas進(jìn)行數(shù)據(jù)篩選并保存至Excel文件中。
1.目標(biāo)網(wǎng)站分析
檢查一下看xhr中有沒有我們需要的數(shù)據(jù)。
很好,就在xhr中用json封裝了數(shù)據(jù)。
2.構(gòu)造相應(yīng)的Request URL
request url中只有一個(gè)參數(shù)變化,那就是“Page=”這個(gè)選項(xiàng)變了,簡(jiǎn)單了😄,一共6頁,直接循環(huán)構(gòu)造了。
for i in range(1,7): url=f'https://search.damai.cn/searchajax.html?keyword=&cty=&ctl=%E6%BC%94%E5%94%B1%E4%BC%9A&sctl=&tsg=0&st=&et=&order=1&pageSize=30&currPage={i}&tn=' # print(url)
3.requests爬蟲走起
直接上代碼:
def crawl(url): headers={ 'cookie': 'cna=J7K2Fok5AXECARu7QWn6+cxu; isg=BCcnDiP-NfKV5bF-OctWuXuatl3xrPuOyBVJJfmQLrZn6ESqAX0y3jrhCuj2ANMG; l=eBSmWoPRQeT6Zn3iBO5whurza77O1CAf1sPzaNbMiIncC6BR1AvOCJxQLtyCvptRR8XcGLLB4nU7C5eTae7_7CDmndLHuI50MbkyCef..', 'user-agent': 'Mozilla/5.0 (Macintosh; Intel Mac OS X 10_13_6) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/81.0.4044.138 Safari/537.36' } response=requests.get(url,headers=headers) json_text=json.loads(response.text) # print(json_text.keys()) rdata=json_text['pageData']['resultData'] # print(rdata) return(rdata)
加一個(gè)headers,簡(jiǎn)單做一個(gè)防反爬。
4.保存至excel文件
基本思路是將每頁數(shù)據(jù)保存成pandas的DataFrame結(jié)構(gòu),然后進(jìn)行拼接,拼接完后再保存到Excel文件中。
inidata=pd.DataFrame(columns=('name','actors','cityname','showtime','price_str','venue','venuecity','verticalPic')) for i in range(1,7): url=f'https://search.damai.cn/searchajax.html?keyword=&cty=&ctl=%E6%BC%94%E5%94%B1%E4%BC%9A&sctl=&tsg=0&st=&et=&order=1&pageSize=30&currPage={i}&tn=' # print(url) # print(crawl(url)) data=pd.DataFrame(crawl(url)) data1=data[['name','actors','cityname','showtime','price_str','venue','venuecity','verticalPic']] inidata=inidata.append(data1) # print(inidata) inidata.to_excel('大麥網(wǎng)演唱會(huì).xlsx',index=0)
5.看看效果
總結(jié)
到此這篇關(guān)于python實(shí)現(xiàn)愛奇藝登陸的密碼RSA加密的文章就介紹到這了,更多相關(guān)python實(shí)現(xiàn)愛奇藝登陸的密碼RSA加密內(nèi)容請(qǐng)搜索腳本之家以前的文章或繼續(xù)瀏覽下面的相關(guān)文章希望大家以后多多支持腳本之家!
- python rsa-oaep加密的示例代碼
- Python實(shí)現(xiàn)常見的幾種加密算法(MD5,SHA-1,HMAC,DES/AES,RSA和ECC)
- Python3加密解密庫Crypto的RSA加解密和簽名/驗(yàn)簽實(shí)現(xiàn)方法實(shí)例
- Python如何基于rsa模塊實(shí)現(xiàn)非對(duì)稱加密與解密
- python使用rsa非對(duì)稱加密過程解析
- Python3.7 基于 pycryptodome 的AES加密解密、RSA加密解密、加簽驗(yàn)簽
- python中的RSA加密與解密實(shí)例解析
- python rsa實(shí)現(xiàn)數(shù)據(jù)加密和解密、簽名加密和驗(yàn)簽功能
- Python3非對(duì)稱加密算法RSA實(shí)例詳解
- Python實(shí)現(xiàn)的rsa加密算法詳解
- python RSA加密的示例
相關(guān)文章
Python?sklearn轉(zhuǎn)換器估計(jì)器和K-近鄰算法
這篇文章主要介紹了Python?sklearn轉(zhuǎn)換器估計(jì)器和K-近鄰算法,文章圍繞主題展開詳細(xì)的內(nèi)容介紹,具有一定的參考價(jià)值,需要的小伙伴可以參考一下2022-08-08Python爬取百度地圖POI數(shù)據(jù)代碼的步驟
爬取百度地圖的POI數(shù)據(jù)涉及法律和道德問題,因?yàn)檫@類數(shù)據(jù)受到版權(quán)保護(hù),且大多數(shù)在線地圖服務(wù)都有嚴(yán)格的反爬蟲措施,這篇文章主要介紹了Python爬取百度地圖POI數(shù)據(jù)代碼,需要的朋友可以參考下2024-08-08Python實(shí)現(xiàn)SMTP郵件發(fā)送
這篇文章主要介紹了基于python實(shí)現(xiàn)SMTP發(fā)送郵件教程,文中通過示例代碼介紹的非常詳細(xì),對(duì)大家的學(xué)習(xí)或者工作具有一定的參考學(xué)習(xí)價(jià)值,需要的朋友可以參考下2020-06-06Python?操作pdf?pdfplumber讀取PDF寫入Excel
這篇文章主要介紹了Python?操作pdf?pdfplumber讀取PDF寫入Excel,文章圍繞主題展開詳細(xì)的內(nèi)容介紹,具有一定的參考價(jià)值,需要的小伙伴可以考察一下2022-08-08使用pyecharts1.7進(jìn)行簡(jiǎn)單的可視化大全
這篇文章主要介紹了使用pyecharts1.7進(jìn)行簡(jiǎn)單的可視化大全,文中通過示例代碼介紹的非常詳細(xì),對(duì)大家的學(xué)習(xí)或者工作具有一定的參考學(xué)習(xí)價(jià)值,需要的朋友們下面隨著小編來一起學(xué)習(xí)學(xué)習(xí)吧2020-05-05