Python爬蟲爬取商品失敗處理方法
更新時間:2021年08月05日 08:28:56 作者:py
在本篇文章里小編給大家整理了一篇關于Python爬蟲爬取商品失敗處理方法,有興趣的朋友們可以學習參考下。
1.登陸網站,開啟開發(fā)者模式。
可以在瀏覽器中點擊右鍵檢查或者F12打開開發(fā)者模式。
2.點選 NetWork,DOC,然后刷新頁面。
在 network 中選擇 doc,在請求的 headers 中搜索 cookie。
3.獲取對應的 cookie 以及 user-agent。
4.在代碼中添加到 headers 里面。
def getHTMLText(url):
kv = {
'cookie': 'adsgadfafegadsgadsfaefasdfaewfadsfag'
'uaer-agent': 'Mozilla/5.0 (Macintosh; Intel Mac OS X 10_14_4) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/73.0.3683.86 Safari/537.36'
}
try:
r = requests.get(url, headers=kv, timeout=30)
r.raise_for_status()
r.encoding = r.apparent_encoding
return r.text
except:
return "gg"
實例擴展:
程序的結構設計
- 提交商品搜索請求,循環(huán)獲取頁面
- 對于每個頁面,提取商品名稱和價格信息
- 將信息輸出
遇到問題
爬取成功,數據有問題
打印 html 文件,返回如下
<script type="text/javascript">
TRLang = {
ERROR_NICK_BLANK: "請?zhí)顚戀~戶名",
ERROR_PASSWORD_BLANK: "請輸入密碼",
ERROR_NICK_PASSWORD_BLANK: "請輸入賬戶名和密碼",
ERROR_CHECKCODE_BLANK: "請輸入驗證碼",
TIPS_REMEMBER_PASSWORD: "記住密碼",
TIPS_NOT_REMEMBER_PSW_ON_PUBLIC: "不要在公共計算機記住密碼,防止賬戶被盜"
};
</script>
到此這篇關于Python爬蟲爬取商品失敗處理方法的文章就介紹到這了,更多相關Python爬蟲爬取商品失敗內容請搜索腳本之家以前的文章或繼續(xù)瀏覽下面的相關文章希望大家以后多多支持腳本之家!
相關文章
python刪除列表元素del,pop(),remove()及clear()
這篇文章主要介紹了python刪除列表元素del,pop(),remove()及clear(),列表元素能增加就可以刪除,這里要給大家介紹的是刪除列表元素,具有一定的參考價值,需要的小伙伴可以參考一下2022-03-03
Python實現(xiàn)批量修改圖片格式和大小的方法【opencv庫與PIL庫】
這篇文章主要介紹了Python實現(xiàn)批量修改圖片格式和大小的方法,結合實例形式分析了Python基于opencv庫與PIL庫針對圖片的讀寫、轉換相關操作技巧,需要的朋友可以參考下2018-12-12

