欧美bbbwbbbw肥妇,免费乱码人妻系列日韩,一级黄片

python爬蟲 線程池創(chuàng)建并獲取文件代碼實例

 更新時間:2019年09月28日 09:37:17   作者:陪伴is最長情的告白  
這篇文章主要介紹了python爬蟲 線程池創(chuàng)建并獲取文件代碼實例,文中通過示例代碼介紹的非常詳細,對大家的學習或者工作具有一定的參考學習價值,需要的朋友可以參考下

本實例主要進行線程池創(chuàng)建,多線程獲取、存儲視頻文件

梨視頻:利用線程池進行視頻爬取

#爬取梨視頻數據
import requests
import re
from lxml import etree
from multiprocessing.dummy import Pool
import random

# 定義獲取視頻數據方法
def getVideoData(url): # url為列表中的視頻url
  return requests.get(url=url,headers=headers).content

# 定義存儲數據方法
def saveVideo(data):
  fileName = str(random.randint(0,5000))+'.mp4'
  with open(fileName,'wb') as fp:
    fp.write(data)

# 爬取數據
#實例化一個線程池對象,開啟5個線程池
pool = Pool(5)

url = 'https://www.pearvideo.com/category_1'
headers = {
  'User-Agent':'Mozilla/5.0 (Windows NT 6.1; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/72.0.3626.119 Safari/537.36'
}
page_text = requests.get(url=url,headers=headers).text
tree = etree.HTML(page_text)
li_list = tree.xpath('//div[@id="listvideoList"]/ul/li')

video_url_list = [] # 存的是將要下載視頻的url
for li in li_list:
  detail_url = 'https://www.pearvideo.com/'+li.xpath('./div/a/@href')[0]
  detail_page = requests.get(url=detail_url,headers=headers).text
  #因為視頻連接不在標簽匯中,而是一個js語句,所以用正則匹配
  video_url = re.findall('srcUrl="(.*?)",vdoUrl',detail_page,re.S)[0]
  video_url_list.append(video_url)
  
# map函數的應用:參數1:回調函數,參數2:列表;
#將列表中的參數賦值給回調函數的形參,讓回調函數處理
video_data_list = pool.map(getVideoData,video_url_list)

pool.map(saveVideo,video_data_list)

以上就是本文的全部內容,希望對大家的學習有所幫助,也希望大家多多支持腳本之家。

相關文章

  • Python基于whois模塊簡單識別網站域名及所有者的方法

    Python基于whois模塊簡單識別網站域名及所有者的方法

    這篇文章主要介紹了Python基于whois模塊簡單識別網站域名及所有者的方法,簡單分析了Python whois模塊的安裝及使用相關操作技巧,需要的朋友可以參考下
    2018-04-04
  • Python?pycharm提交代碼遇到沖突解決方法

    Python?pycharm提交代碼遇到沖突解決方法

    這篇文章主要介紹了Python?pycharm提交代碼遇到沖突解決方法,文章圍繞主題展開詳細的內容介紹,具有一定的參考價值,需要的小伙伴可以參考一下
    2022-08-08
  • Django密碼存儲策略分析

    Django密碼存儲策略分析

    這篇文章主要介紹了Django密碼存儲策略分析,文中通過示例代碼介紹的非常詳細,對大家的學習或者工作具有一定的參考學習價值,需要的朋友們下面隨著小編來一起學習學習吧
    2020-01-01
  • Pandas提取含有指定字符串的行(完全匹配,部分匹配)

    Pandas提取含有指定字符串的行(完全匹配,部分匹配)

    本文主要介紹了Pandas提取含有指定字符串的行(完全匹配,部分匹配),文中通過示例代碼介紹的非常詳細,對大家的學習或者工作具有一定的參考學習價值,需要的朋友們下面隨著小編來一起學習學習吧
    2023-02-02
  • 詳解如何使用OpenCV和像素處理圖像灰度化

    詳解如何使用OpenCV和像素處理圖像灰度化

    這篇文章主要為大家介紹了如何使用OpenCV和像素處理圖像灰度化的方法示例詳解,有需要的朋友可以借鑒參考下,希望能夠有所幫助,祝大家多多進步,早日升職加薪
    2023-04-04
  • Python繪制KS曲線的實現方法

    Python繪制KS曲線的實現方法

    本篇文章主要介紹了Python繪制KS曲線的實現方法,小編覺得挺不錯的,現在分享給大家,也給大家做個參考。一起跟隨小編過來看看吧
    2018-08-08
  • Python Web靜態(tài)服務器非堵塞模式實現方法示例

    Python Web靜態(tài)服務器非堵塞模式實現方法示例

    這篇文章主要介紹了Python Web靜態(tài)服務器非堵塞模式實現方法,結合實例形式分析了Python單進程非堵塞模式實現的Web靜態(tài)服務器相關操作技巧,需要的朋友可以參考下
    2019-11-11
  • Python @property使用方法解析

    Python @property使用方法解析

    這篇文章主要介紹了Python @property使用方法解析,文中通過示例代碼介紹的非常詳細,對大家的學習或者工作具有一定的參考學習價值,需要的朋友可以參考下
    2019-09-09
  • Python面向對象編程基礎實例分析

    Python面向對象編程基礎實例分析

    這篇文章主要介紹了Python面向對象編程基礎,結合實例形式分析了Python面向對象編程類的定義、繼承、特殊方法及模塊相關原理與操作技巧,需要的朋友可以參考下
    2020-01-01
  • tensorflow-gpu安裝的常見問題及解決方案

    tensorflow-gpu安裝的常見問題及解決方案

    這篇文章主要介紹了tensorflow-gpu安裝的常見問題及解決方案,本文給大家介紹的非常詳細,具有一定的參考借鑒價值,需要的朋友參考下吧,需要的朋友可以參考下
    2020-01-01

最新評論