python抓取網(wǎng)站的圖片并下載到本地的方法
更新時間:2018年05月22日 14:06:53 作者:wickedvalley
今天小編就為大家分享一篇python抓取網(wǎng)站的圖片并下載到本地的方法,具有很好的參考價值,希望對大家有所幫助。一起跟隨小編過來看看吧
實例如下所示:
#!/usr/bin/python # -*- coding: UTF-8 -*- import re import urllib,urllib2; #通過url獲取網(wǎng)頁 def getHtml(url): # 要設(shè)置請求頭,讓服務(wù)器知道不是機器人 user_agent = 'Mozilla/4.0 (compatible; MSIE 5.5; Windows NT)' headers = {'User-Agent': user_agent} request=urllib2.Request(url,headers=headers); page = urllib2.urlopen(request); html = page.read() return html #通過正則表達(dá)式來獲取圖片地址,并下載到本地 def getImg(html): reg = r'src="(.+?\.jpg)"' imgre = re.compile(reg) imglist = imgre.findall(html) x = 0 for imgurl in imglist: print imgurl; #通過urlretrieve函數(shù)把數(shù)據(jù)下載到本地的D:\\images,所以你需要創(chuàng)建目錄 urllib.urlretrieve(imgurl, 'D:\\images\\%s.jpg' % x) x = x + 1 html = getHtml("http://www.qiushibaike.com/imgrank/") getImg(html)
以上這篇python抓取網(wǎng)站的圖片并下載到本地的方法就是小編分享給大家的全部內(nèi)容了,希望能給大家一個參考,也希望大家多多支持腳本之家。
相關(guān)文章
基于Python+Appium實現(xiàn)京東雙十一自動領(lǐng)金幣功能
一年一度的雙十一即將來臨,各大平臺都在搞活動,京東天貓忙的不易樂乎,做任務(wù)領(lǐng)金幣的過程真的好無聊,今天小編給大家分享一篇教程通關(guān)Python+Appium實現(xiàn)京東雙十一自動領(lǐng)金幣功能,需要的朋友可以參考下2019-10-10在Python中預(yù)先初始化列表內(nèi)容和長度的實現(xiàn)
今天小編就為大家分享一篇在Python中預(yù)先初始化列表內(nèi)容和長度的實現(xiàn),具有很好的參考價值,希望對大家有所幫助。一起跟隨小編過來看看吧2019-11-11python 實現(xiàn)學(xué)生信息管理系統(tǒng)的示例
本篇文章主要分享python學(xué)生管理系統(tǒng)的使用,文章非常詳細(xì)地介紹了通過示例代碼實現(xiàn)的學(xué)生管理系統(tǒng),該系統(tǒng)對每個人的研究或工作都有一定的參考學(xué)習(xí)價值,希望你能在其中有所收獲。2020-11-11python使用tensorflow深度學(xué)習(xí)識別驗證碼
這篇文章主要介紹了python使用tensorflow深度學(xué)習(xí)識別驗證碼,小編覺得挺不錯的,現(xiàn)在分享給大家,也給大家做個參考。一起跟隨小編過來看看吧2018-04-04Python中ModuleNotFoundError錯誤的問題解決
本文主要介紹了Python中ModuleNotFoundError錯誤的問題解決,文中通過示例代碼介紹的非常詳細(xì),對大家的學(xué)習(xí)或者工作具有一定的參考學(xué)習(xí)價值,需要的朋友們下面隨著小編來一起學(xué)習(xí)學(xué)習(xí)吧2023-02-02python實現(xiàn)kNN算法識別手寫體數(shù)字的示例代碼
這篇文章主要介紹了python實現(xiàn)kNN算法識別手寫體數(shù)字的示例代碼,文中通過示例代碼介紹的非常詳細(xì),對大家的學(xué)習(xí)或者工作具有一定的參考學(xué)習(xí)價值,需要的朋友們下面隨著小編來一起學(xué)習(xí)學(xué)習(xí)吧2019-08-08