Python爬蟲實現(xiàn)獲取動態(tài)gif格式搞笑圖片的方法示例

更新時間：2018年12月24日 09:46:56 作者：楓奇

這篇文章主要介紹了Python爬蟲實現(xiàn)獲取動態(tài)gif格式搞笑圖片的方法,結合實例形式分析了Python針對gif格式圖片的爬取、下載等相關操作技巧,需要的朋友可以參考下

本文實例講述了Python爬蟲實現(xiàn)獲取動態(tài)gif格式搞笑圖片的方法。分享給大家供大家參考，具體如下：

有時候看到一些喜歡的動圖，如果一個個取保存挺麻煩，有的網(wǎng)站還不支持右鍵保存，因此使用python來獲取動態(tài)圖，就看看就很有意思了

本次爬取的網(wǎng)站是居然搞笑網(wǎng) http://www.zbjuran.com/dongtai/list_4_1.html

思路：

獲取當前頁面內(nèi)容

查找頁面中動圖所代表的url地址

保存這個地址內(nèi)容到本地

如果想爬取多頁，就可以加上一個循環(huán)條件

代碼：

#!/usr/bin/python
#coding:utf-8
import urllib2,time,uuid,urllib,os,sys,re
from bs4 import BeautifulSoup
reload(sys)
sys.setdefaultencoding('utf-8')
#獲取頁面內(nèi)容
def getHtml(url):
    try:
        print url
        html = urllib2.urlopen(url).read()#.decode('utf-8')#解碼為utf-8
    except:
        return
    return html
#獲取動圖所代表的url列表
def getImagUrl(html):
    if not html:
        print 'nothing can be found'
        return
    ImagUrlList=[]
    soup=BeautifulSoup(html,'lxml')
    #獲取item列表
    items=soup.find("div",{"class":"main"}).find_all('div',{'class':'item'})
    for item in items:
        target={}
        #通過if語句，過濾廣告項
        if item.find('div',{"class":"text"}):
            #獲取url
            imgurl=item.find('div',{"class":"text"}).find('img').get('src')
            target['url']=imgurl
            #獲取名字
            target['name']=item.find('h3').text
            ImagUrlList.append(target)
    return ImagUrlList
#下載圖片到本地
def download(author,imgurl,typename,pageNo):
    #定義文件夾的名字
    x = time.localtime(time.time())
    foldername = str(x.__getattribute__("tm_year"))+"-"+str(x.__getattribute__("tm_mon"))+"-"+str(x.__getattribute__("tm_mday"))
    download_img=None
    picpath = 'Jimy/%s/%s/%s' % (foldername,typename,str(pageNo))
    filename = author+str(uuid.uuid1())
    pic_type=imgurl[-3:]
    if not os.path.exists(picpath):
        os.makedirs(picpath)
    target = picpath+"/%s.%s" % (filename,pic_type)
    print "動圖存貯位置:"+target
    download_img = urllib.urlretrieve(imgurl, target)#將圖片下載到指定路徑中
    print "圖片出處為："+imgurl
    return download_img
#退出函數(shù)
def myquit():
    print "Bye Bye!"
    exit(0)
def start(pageNo):
    targeturl="http://www.zbjuran.com/dongtai/list_4_%s.html" % str(pageNo)
    html = getHtml(targeturl)
    urllist=getImagUrl(html)
    for imgurl in urllist:
        download(imgurl['name'],imgurl['url'],'搞笑動圖',pageNo)
if __name__ == '__main__':
    print '''
            *****************************************
            **  Welcome to Spider of GIF     **
            **   Created on 2017-3-16      **
            **   @author: Jimy         **
            *****************************************'''
    pageNo = raw_input("Input the page number you want to scratch (1-50),please input 'quit' if you want to quit\n\
請輸入要爬取的頁面，范圍為（1-100），如果退出，請輸入Q>\n>")
    while not pageNo.isdigit() or int(pageNo) > 50 or int(pageNo) < 1:
        if pageNo == 'Q':
            myquit()
        print "Param is invalid , please try again."
        pageNo = raw_input("Input the page number you want to scratch >")
    print pageNo
    start(pageNo)
    #第一次爬取結束
    pageNo = raw_input("Input the page number you want to scratch (1-50),please input 'quit' if you want to quit\n\
請輸入總共需要爬取的頁面，范圍為（1-5000），如果退出，請輸入Q>\n>")
    while not pageNo.isdigit() or int(pageNo) > 5000 or int(pageNo) < 1:
        if pageNo == 'Q':
            myquit()
        print "Param is invalid , please try again."
        pageNo = raw_input("Input the page number you want to scratch >")
    #循環(huán)遍歷，爬取多頁
    for num in xrange(int(pageNo)):
        start(str(num+1))

結果如下：

                        *****************************************
                        **    Welcome to Spider of GIF         **
                        **      Created on 2017-3-16           **
                        **      @author: Jimy                  **
                        *****************************************
Input the page number you want to scratch (1-50),please input 'quit' if you want to quit
請輸入要爬取的頁面，范圍為（1-100），如果退出，請輸入Q>
>1
1
http://www.zbjuran.com/dongtai/list_4_1.html
動圖存貯位置:Jimy/2017-3-16/搞笑動圖/1/真是艱難的選擇。3f0fe8f6-09f8-11e7-9161-f8bc12753d1e.gif
圖片出處為：http://www.zbjuran.com/uploads/allimg/170206/10-1F206135ZHJ.gif
動圖存貯位置:Jimy/2017-3-16/搞笑動圖/1/這么會被打死吧……3fa9da88-09f8-11e7-9161-f8bc12753d1e.gif
圖片出處為：http://www.zbjuran.com/uploads/allimg/170206/10-1F206135H35U.gif
動圖存貯位置:Jimy/2017-3-16/搞笑動圖/1/一看就是印度……4064e60c-09f8-11e7-9161-f8bc12753d1e.gif
圖片出處為：http://www.zbjuran.com/uploads/allimg/170206/10-1F20613543c50.gif
動圖存貯位置:Jimy/2017-3-16/搞笑動圖/1/新垣結衣的正經(jīng)工作臉414b4f52-09f8-11e7-9161-f8bc12753d1e.gif
圖片出處為：http://www.zbjuran.com/uploads/allimg/170206/10-1F206135250553.gif
動圖存貯位置:Jimy/2017-3-16/搞笑動圖/1/妹子這是在搖什么的421afa86-09f8-11e7-9161-f8bc12753d1e.gif
圖片出處為：http://www.zbjuran.com/uploads/allimg/170206/10-1F20613493N03.gif
Input the page number you want to scratch (1-50),please input 'quit' if you want to quit
請輸入總共需要爬取的頁面，范圍為（1-5000），如果退出，請輸入Q>
>Q
Bye Bye!

最終就能夠獲得動態(tài)圖了

更多關于Python相關內(nèi)容可查看本站專題：《Python Socket編程技巧總結》、《Python正則表達式用法總結》、《Python數(shù)據(jù)結構與算法教程》、《Python函數(shù)使用技巧總結》、《Python字符串操作技巧匯總》、《Python入門與進階經(jīng)典教程》及《Python文件與目錄操作技巧匯總》

希望本文所述對大家Python程序設計有所幫助。

您可能感興趣的文章:

Python退出時強制運行一段代碼的實現(xiàn)方法
這篇文章主要介紹了Python退出時強制運行一段代碼,本文通過實例代碼給大家介紹的非常詳細，對大家的學習或工作具有一定的參考借鑒價值，需要的朋友可以參考下
2020-04-04
Python編寫nmap掃描工具
NMAP是一款開源的網(wǎng)絡探測和安全審核的工具，今天我們用python的模擬實現(xiàn)一個簡單版本的端口掃描工具，具有一定的參考價值，感興趣的小伙伴們可以參考一下
2021-07-07
如何用 Python 子進程關閉 Excel 自動化中的彈窗
這篇文章主要介紹了如何用 Python 子進程關閉 Excel 自動化中的彈窗，幫助大家更好的理解和學習使用python，感興趣的朋友可以了解下
2021-05-05
minpy使用GPU加速Numpy科學計算方式
這篇文章主要介紹了minpy使用GPU加速Numpy科學計算方式，具有很好的參考價值，希望對大家有所幫助。如有錯誤或未考慮完全的地方，望不吝賜教
2023-01-01
python 讀取文件并把矩陣轉(zhuǎn)成numpy的兩種方法
今天小編就為大家分享一篇python 讀取文件并把矩陣轉(zhuǎn)成numpy的兩種方法，具有很好的參考價值，希望對大家有所幫助。一起跟隨小編過來看看吧
2019-02-02
python2.7 安裝pip的方法步驟（管用）
這篇文章主要介紹了python2.7 安裝pip的方法，文中通過示例代碼介紹的非常詳細，對大家的學習或者工作具有一定的參考學習價值，需要的朋友們下面隨著小編來一起學習學習吧
2019-05-05
Python venv虛擬環(huán)境配置過程解析
這篇文章主要介紹了Python venv虛擬環(huán)境配置過程解析,文中通過示例代碼介紹的非常詳細，對大家的學習或者工作具有一定的參考學習價值,需要的朋友可以參考下
2020-07-07
python解決漢字編碼問題：Unicode Decode Error
最近在利用python讀取一個含有漢字的文檔時導致出現(xiàn)了亂碼，并報出了兩個錯誤，無奈只能上網(wǎng)找尋答案，后通過網(wǎng)友的幫助解決了這個問題，想著總結一下，下面這篇文章就主要介紹了python如何解決漢字編碼問題，有需要的朋友們可以參考借鑒。
2017-01-01
這篇文章主要介紹了Python面向?qū)ο筇厥鈱傩约胺椒ń馕?文中通過示例代碼介紹的非常詳細，對大家的學習或者工作具有一定的參考學習價值,需要的朋友可以參考下
2020-09-09