欧美bbbwbbbw肥妇,免费乱码人妻系列日韩,一级黄片

python多線程http下載實現(xiàn)示例

 更新時間:2013年12月30日 09:17:14   作者:  
python多線程http下載實現(xiàn)示例,大家參考使用吧

測試平臺 Ubuntu 13.04 X86_64 Python 2.7.4

花了將近兩個小時, 問題主要剛開始沒有想到傳一個文件對象到線程里面去, 導致下載下來的文件和源文件MD5不一樣,浪費不少時間.

有興趣的同學可以拿去加上參數(shù),改進下, 也可以加上斷點續(xù)傳.

復制代碼 代碼如下:

# -*- coding: utf-8 -*-
# Author: ToughGuy
# Email: wj0630@gmail.com
# 寫這玩意兒是為了初步了解下python的多線程機制
# 平時沒寫注釋的習慣, 這次花時間在代碼里面寫上注釋也是希望有問題的地方請各位指正, 因為可能我自己也沒弄明白.
# 測試平臺 Ubuntu 13.04 X86_64 Python 2.7.4

import threading
import urllib2
import sys

max_thread = 10
# 初始化鎖
lock = threading.RLock()

class Downloader(threading.Thread):
    def __init__(self, url, start_size, end_size, fobj, buffer):
        self.url = url
        self.buffer = buffer
        self.start_size = start_size
        self.end_size = end_size
        self.fobj = fobj
        threading.Thread.__init__(self)

    def run(self):
        """
            馬甲而已
        """
        with lock:
            print 'starting: %s' % self.getName()
        self._download()

    def _download(self):
        """
            我才是搬磚的
        """
        req = urllib2.Request(self.url)
        # 添加HTTP Header(RANGE)設置下載數(shù)據(jù)的范圍
        req.headers['Range'] = 'bytes=%s-%s' % (self.start_size, self.end_size)
        f = urllib2.urlopen(req)
        # 初始化當前線程文件對象偏移量
        offset = self.start_size
        while 1:
            block = f.read(self.buffer)
            # 當前線程數(shù)據(jù)獲取完畢后則退出
            if not block:
                with lock:
                    print '%s done.' % self.getName()
                break
            # 寫如數(shù)據(jù)的時候當然要鎖住線程
            # 使用 with lock 替代傳統(tǒng)的 lock.acquire().....lock.release()
            # 需要python >= 2.5
            with lock:
                sys.stdout.write('%s saveing block...' % self.getName())
                # 設置文件對象偏移地址
                self.fobj.seek(offset)
                # 寫入獲取到的數(shù)據(jù)
                self.fobj.write(block)
                offset = offset + len(block)
                sys.stdout.write('done.\n')


def main(url, thread=3, save_file='', buffer=1024):
    # 最大線程數(shù)量不能超過max_thread
    thread = thread if thread <= max_thread else max_thread
    # 獲取文件的大小
    req = urllib2.urlopen(url)
    size = int(req.info().getheaders('Content-Length')[0])
    # 初始化文件對象
    fobj = open(save_file, 'wb')
    # 根據(jù)線程數(shù)量計算 每個線程負責的http Range 大小
    avg_size, pad_size = divmod(size, thread)
    plist = []
    for i in xrange(thread):
        start_size = i*avg_size
        end_size = start_size + avg_size - 1
        if i == thread - 1:
            # 最后一個線程加上pad_size
            end_size = end_size + pad_size + 1
        t = Downloader(url, start_size, end_size, fobj, buffer)
        plist.append(t)

    #  開始搬磚
    for t in plist:
        t.start()

    # 等待所有線程結束
    for t in plist:
        t.join()

    # 結束當然記得關閉文件對象
    fobj.close()
    print 'Download completed!'

if __name__ == '__main__':
    url = 'http://192.168.1.2:8082/downloads/10M.zip'
    main(url=url, thread=10, save_file='test.iso', buffer=4096)

相關文章

  • python中使用pymssql庫操作MSSQL數(shù)據(jù)庫

    python中使用pymssql庫操作MSSQL數(shù)據(jù)庫

    這篇文章主要給大家介紹了關于python中使用pymssql庫操作MSSQL數(shù)據(jù)庫的相關資料,最近在學習python,發(fā)現(xiàn)好像沒有對pymssql的詳細說明,于是乎把官方文檔學習一遍,重要部分做個歸檔,方便以后查閱,需要的朋友可以參考下
    2023-08-08
  • 深入理解Python虛擬機中描述器的實現(xiàn)原理

    深入理解Python虛擬機中描述器的實現(xiàn)原理

    這篇文章主要給大家介紹一個我們在使用類的時候經(jīng)常使用但是卻很少在意的黑科技——描述器的實現(xiàn)原理,文中的示例代碼講解詳細,需要的可以參考一下
    2023-05-05
  • python常見排序算法基礎教程

    python常見排序算法基礎教程

    這篇文章主要為大家詳細介紹了python算法的基礎教程,具有一定的參考價值,感興趣的小伙伴們可以參考一下
    2017-04-04
  • python 并發(fā)編程 阻塞IO模型原理解析

    python 并發(fā)編程 阻塞IO模型原理解析

    這篇文章主要介紹了python 并發(fā)編程 阻塞IO模型原理解析,文中通過示例代碼介紹的非常詳細,對大家的學習或者工作具有一定的參考學習價值,需要的朋友可以參考下
    2019-08-08
  • python list 查詢是否存在并且并返回下標的操作

    python list 查詢是否存在并且并返回下標的操作

    這篇文章主要介紹了python list 查詢是否存在并且并返回下標的操作,具有很好的參考價值,希望對大家有所幫助。如有錯誤或未考慮完全的地方,望不吝賜教
    2021-05-05
  • pytorch加載預訓練模型與自己模型不匹配的解決方案

    pytorch加載預訓練模型與自己模型不匹配的解決方案

    這篇文章主要介紹了pytorch加載預訓練模型與自己模型不匹配的解決方案,具有很好的參考價值,希望對大家有所幫助。如有錯誤或未考慮完全的地方,望不吝賜教
    2021-05-05
  • 使用python數(shù)據(jù)清洗代碼實例

    使用python數(shù)據(jù)清洗代碼實例

    這篇文章主要介紹了使用python數(shù)據(jù)清洗代碼實例,分享一下近期用python做數(shù)據(jù)清洗匯總的相關代碼,這里我們用到的python包有pandas、numpy、os等,需要的朋友可以參考下
    2023-07-07
  • Python從使用線程到使用async/await的深入講解

    Python從使用線程到使用async/await的深入講解

    Python在3.5版本中引入了關于協(xié)程的語法糖async和await,所以下面這篇文章主要給大家介紹了關于Python從使用線程到使用async/await的相關資料,文中通過示例代碼介紹的非常詳細,需要的朋友可以參考下
    2018-09-09
  • python實現(xiàn)TCP服務器端與客戶端的方法詳解

    python實現(xiàn)TCP服務器端與客戶端的方法詳解

    這篇文章主要介紹了python實現(xiàn)TCP服務器端與客戶端的方法,以實例形式詳解分析了Python實現(xiàn)服務器端與客戶端的技巧,具有一定參考借鑒價值,需要的朋友可以參考下
    2015-04-04
  • python如何查看微信消息撤回

    python如何查看微信消息撤回

    這篇文章主要為大家詳細介紹了python實現(xiàn)查看微信消息撤回的方法,具有一定的參考價值,感興趣的小伙伴們可以參考一下
    2018-11-11

最新評論