欧美bbbwbbbw肥妇,免费乱码人妻系列日韩,一级黄片

Python實現(xiàn)從訂閱源下載圖片的方法

 更新時間:2015年03月11日 09:38:54   作者:saintatgod  
這篇文章主要介紹了Python實現(xiàn)從訂閱源下載圖片的方法,涉及Python采集的技巧,具有一定參考借鑒價值,需要的朋友可以參考下

本文實例講述了Python實現(xiàn)從訂閱源下載圖片的方法。分享給大家供大家參考。具體如下:

這段代碼是基于python 3.4實現(xiàn)的,和python2.X 比起來有了好多差別啊。
這是一個練習,數(shù)據(jù)源來自網(wǎng)易訂閱。代碼如下:

復制代碼 代碼如下:
__author__ = 'Saint'
import os
import urllib.request
import json
from html.parser import HTMLParser
# 從獲取的網(wǎng)頁內容篩選圖片的內容
class MyHtmlParser(HTMLParser):
    links = []
    def handle_starttag(self, tag, attrs):
        if tag == "img":
            if len(attrs) == 0:
                pass
            else:
                for name, value in attrs:
                    if name == "src":
                        self.links.append(value)
class Down(object):
    # 總的目錄
    img_path = "E:/saint"
    # 下載目錄
    dir = ''
    # 采集源地址
    collect_links = ["http://dy.163.com/v2/media/articlelist/T1374483113516-1", "http://dy.163.com/v2/media/articlelist/T1420776257254-1", "http://dy.163.com/v2/media/articlelist/T1376641060407-1"]
    img_links = "http://dy.163.com/v2/article"
    def handleCollect(self):
        for collect_link in self.collect_links:
            notice = "開始從[" + collect_link + "]采集圖片"
            print(notice)
            # 建立下載的目錄
            dir_name = collect_link.split("/")[-1]
            self.isDirExists(dir_name)
            dict = self.getListFromSubscribe(collect_link)
            if dict == False:
                print("數(shù)據(jù)采集失敗,是否繼續(xù)(y/n)")
                op = input();
                if op == "y":
                    os.system("cls")
                    pass
                elif op == "n":
                    print("停止采集")
                    break
                else:
                    os.system("cls")
                    print("非法輸入")
                    break
            else:
                for page in dict:
                    page_uri = self.img_links + "/" + page["tid"] + "/" + page["docid"]
                    self.getImgFromUri(page_uri)
                    print("是否繼續(xù)(y/n)")
                    new_op = input();
                    if new_op == "n":
                        os.system("cls")
                        print("采集完畢")
                        break
        print("OK")
    # 從訂閱源獲取目錄
    def getListFromSubscribe(self, uri):
        res = urllib.request.urlopen(uri)
        if res.code < 200 or res.code > 300:
            os.system("clear")
            return False
        else:
            result = res.read().decode("gbk") # 3.4版本的read()返回的是byte類型,需要decode()處理,選項是網(wǎng)頁編碼
            dict = json.loads(result)
            if dict['code'] != 1:
                print(dict['msg'])
                return False
            else:
                return dict['data']
    # 獲取本期訂閱的網(wǎng)頁,并從網(wǎng)頁中提取出來需要的圖片
    def getImgFromUri(self, uri):
        html_code = urllib.request.urlopen(uri).read().decode("gbk")
        hp = MyHtmlParser()
        hp.feed(html_code)
        hp.close()
 
        for link in hp.links: # hp.links 是圖片的下載地址的列表
            self.writeToDisk(link)
    # 檢查文件目錄是否存在,如果不存在,則創(chuàng)建目錄
    def isDirExists(self, dir_name):
        self.dir = self.img_path + dir_name
        isExists = os.path.exists(self.dir)
        if not isExists:
            os.makedirs(self.dir)
            return True
        else:
            return True
    # 下載文件,并且寫入磁盤
    def writeToDisk(self, url):
        os.chdir(self.dir)
        file = urllib.request.urlopen(url).read()
        file_name = url.split("/")[-1]
        open(file_name, "wb").write(file)
        return True
if __name__ == "__main__":
    down = Down()
    down.handleCollect()

希望本文所述對大家的Python程序設計有所幫助。

相關文章

  • Python Matplotlib 實現(xiàn)3D繪圖詳解

    Python Matplotlib 實現(xiàn)3D繪圖詳解

    Matplotlib在二維繪圖的基礎上,構建了一部分較為實用的3D繪圖程序包。本文將為大家詳細介紹通過調用該程序包接口繪制 3D散點圖、3D曲面圖、3D線框圖。感興趣的同學可以了解一下
    2021-11-11
  • python自動化測試selenium核心技術三種等待方式詳解

    python自動化測試selenium核心技術三種等待方式詳解

    這篇文章主要為大家介紹了python自動化測試selenium的核心技術三種等待方式示例詳解,有需要的朋友可以借鑒參考下,希望能夠有所幫助,祝大家多多進步早日升職加薪
    2021-11-11
  • 淺談python鎖與死鎖問題

    淺談python鎖與死鎖問題

    這篇文章主要介紹了python鎖與死鎖問題,幫助大家更好的理解和學習python,感興趣的朋友可以了解下
    2020-08-08
  • python獲取全國最新省市區(qū)數(shù)據(jù)并存入表實例代碼

    python獲取全國最新省市區(qū)數(shù)據(jù)并存入表實例代碼

    我們在開發(fā)中經(jīng)常會遇到獲取省市區(qū)等信息的時候,下面這篇這篇文章主要給大家介紹了關于python獲取全國最新省市區(qū)數(shù)據(jù)并存入表的相關資料,需要的朋友可以參考下
    2021-08-08
  • Python PyPDF2模塊安裝使用解析

    Python PyPDF2模塊安裝使用解析

    這篇文章主要介紹了Python PyPDF2模塊安裝使用解析,文中通過示例代碼介紹的非常詳細,對大家的學習或者工作具有一定的參考學習價值,需要的朋友可以參考下
    2020-01-01
  • Python中win32com模塊的使用

    Python中win32com模塊的使用

    本文主要介紹了Python中win32com模塊的使用,文中通過示例代碼介紹的非常詳細,對大家的學習或者工作具有一定的參考學習價值,需要的朋友們下面隨著小編來一起學習學習吧
    2023-01-01
  • Python函數(shù)裝飾器原理與用法詳解

    Python函數(shù)裝飾器原理與用法詳解

    這篇文章主要介紹了Python函數(shù)裝飾器原理與用法,結合實例形式詳細分析了Python裝飾器的原理、功能、分類、常見操作技巧與使用注意事項,需要的朋友可以參考下
    2019-08-08
  • Pyqt5 實現(xiàn)多線程文件搜索的案例

    Pyqt5 實現(xiàn)多線程文件搜索的案例

    這篇文章主要介紹了Pyqt5 實現(xiàn)多線程文件搜索的案例,具有很好的參考價值,希望對大家有所幫助。一起跟隨小編過來看看吧
    2021-03-03
  • Python中使用strip()方法刪除字符串中空格的教程

    Python中使用strip()方法刪除字符串中空格的教程

    這篇文章主要介紹了Python中使用strip()方法刪除字符串中空格的教程,是Python入門學習中的基礎知識,需要的朋友可以參考下
    2015-05-05
  • django 擴展user用戶字段inlines方式

    django 擴展user用戶字段inlines方式

    這篇文章主要介紹了django 擴展user用戶字段inlines方式,具有很好的參考價值,希望對大家有所幫助。一起跟隨小編過來看看吧
    2020-03-03

最新評論