python抓取網(wǎng)站的圖片并下載到本地的方法
實(shí)例如下所示:
#!/usr/bin/python # -*- coding: UTF-8 -*- import re import urllib,urllib2; #通過url獲取網(wǎng)頁 def getHtml(url): # 要設(shè)置請(qǐng)求頭,讓服務(wù)器知道不是機(jī)器人 user_agent = 'Mozilla/4.0 (compatible; MSIE 5.5; Windows NT)' headers = {'User-Agent': user_agent} request=urllib2.Request(url,headers=headers); page = urllib2.urlopen(request); html = page.read() return html #通過正則表達(dá)式來獲取圖片地址,并下載到本地 def getImg(html): reg = r'src="(.+?\.jpg)"' imgre = re.compile(reg) imglist = imgre.findall(html) x = 0 for imgurl in imglist: print imgurl; #通過urlretrieve函數(shù)把數(shù)據(jù)下載到本地的D:\\images,所以你需要?jiǎng)?chuàng)建目錄 urllib.urlretrieve(imgurl, 'D:\\images\\%s.jpg' % x) x = x + 1 html = getHtml("http://www.qiushibaike.com/imgrank/") getImg(html)
以上這篇python抓取網(wǎng)站的圖片并下載到本地的方法就是小編分享給大家的全部內(nèi)容了,希望能給大家一個(gè)參考,也希望大家多多支持腳本之家。
相關(guān)文章
基于Python+Appium實(shí)現(xiàn)京東雙十一自動(dòng)領(lǐng)金幣功能
一年一度的雙十一即將來臨,各大平臺(tái)都在搞活動(dòng),京東天貓忙的不易樂乎,做任務(wù)領(lǐng)金幣的過程真的好無聊,今天小編給大家分享一篇教程通關(guān)Python+Appium實(shí)現(xiàn)京東雙十一自動(dòng)領(lǐng)金幣功能,需要的朋友可以參考下2019-10-10在Python中預(yù)先初始化列表內(nèi)容和長度的實(shí)現(xiàn)
今天小編就為大家分享一篇在Python中預(yù)先初始化列表內(nèi)容和長度的實(shí)現(xiàn),具有很好的參考價(jià)值,希望對(duì)大家有所幫助。一起跟隨小編過來看看吧2019-11-11python 實(shí)現(xiàn)學(xué)生信息管理系統(tǒng)的示例
本篇文章主要分享python學(xué)生管理系統(tǒng)的使用,文章非常詳細(xì)地介紹了通過示例代碼實(shí)現(xiàn)的學(xué)生管理系統(tǒng),該系統(tǒng)對(duì)每個(gè)人的研究或工作都有一定的參考學(xué)習(xí)價(jià)值,希望你能在其中有所收獲。2020-11-11python使用tensorflow深度學(xué)習(xí)識(shí)別驗(yàn)證碼
這篇文章主要介紹了python使用tensorflow深度學(xué)習(xí)識(shí)別驗(yàn)證碼,小編覺得挺不錯(cuò)的,現(xiàn)在分享給大家,也給大家做個(gè)參考。一起跟隨小編過來看看吧2018-04-04Python中ModuleNotFoundError錯(cuò)誤的問題解決
本文主要介紹了Python中ModuleNotFoundError錯(cuò)誤的問題解決,文中通過示例代碼介紹的非常詳細(xì),對(duì)大家的學(xué)習(xí)或者工作具有一定的參考學(xué)習(xí)價(jià)值,需要的朋友們下面隨著小編來一起學(xué)習(xí)學(xué)習(xí)吧2023-02-02python實(shí)現(xiàn)kNN算法識(shí)別手寫體數(shù)字的示例代碼
這篇文章主要介紹了python實(shí)現(xiàn)kNN算法識(shí)別手寫體數(shù)字的示例代碼,文中通過示例代碼介紹的非常詳細(xì),對(duì)大家的學(xué)習(xí)或者工作具有一定的參考學(xué)習(xí)價(jià)值,需要的朋友們下面隨著小編來一起學(xué)習(xí)學(xué)習(xí)吧2019-08-08