欧美bbbwbbbw肥妇,免费乱码人妻系列日韩,一级黄片

Python 短視頻爬蟲教程

 更新時(shí)間:2021年11月22日 11:08:15   作者:嗨學(xué)編程  
今天給大家?guī)硪黄老x小教程,很簡單的幾十行代碼就可以實(shí)現(xiàn)了,爬取的目標(biāo)是短視頻,感興趣的同學(xué)快來跟著小編往下看吧

好難受,上次發(fā)了做游戲的居然沒人看,每天為了給你們寫啥,老夫心都操碎了~

在這里插入圖片描述

真的是,今天來給大家爬一波短視頻網(wǎng)站吧,都是些很養(yǎng)眼的~

在這里插入圖片描述

網(wǎng)站地址在代碼里面,大家用心一下就能看到了。

使用的軟件

python 3.8
pycharm 2021.2

模塊

requests
parsel
re
concurrent.futures
time
warnings

不會(huì)安裝模塊看這篇:python模塊的安裝以及安裝失敗的解決方法

知道你們不想看那些步驟,我直接上代碼吧

import requests
import parsel
import re
import concurrent.futures
import time
import warnings

# 取消警告
warnings.filterwarnings("ignore")


def get_html(url):
    """發(fā)送請求獲取網(wǎng)頁源代碼"""
    html_data = requests.get(url=url, verify=False).text
    return html_data


def parse_data_1(html_data):
    """第一次解析, 拿到所有的詳情頁鏈接"""
    selector = parsel.Selector(html_data)
    url_list = selector.xpath('//a[@class="meta-title"]/@href').getall()
    return url_list


def parse_data_2(html_data):
    """第二次解析, 獲取視頻鏈接"""
    video_url = re.findall('url: "(.*?)",', html_data)[0]
    return video_url


def save(video_url):
    """保存視頻"""
    title = video_url.split('/')[-1]    # 取鏈接當(dāng)中的字段作為標(biāo)題
    video_data = requests.get(video_url, verify=False).content    # 發(fā)送網(wǎng)絡(luò)請求
    with open(f'video/{title}', mode='wb') as f:
        f.write(video_data)
    print(title, "爬取成功!!!")

start_time = time.time()
url = 'https://www.520mmtv.com/hd/rewu.html'
# 1. 向目標(biāo)網(wǎng)站發(fā)送請求
html_data = get_html(url=url)
# 2. 第一次解析數(shù)據(jù) 提取詳情頁鏈接
url_list = parse_data_1(html_data=html_data)
for info_url in url_list[:10]:
    # 3. 向詳情頁發(fā)送請求
    html_data_2 = get_html(url=info_url)
    # 4. 第二次解析數(shù)據(jù) 提取視頻播放地址
    video_url = parse_data_2(html_data=html_data_2)
    # 5. 保存視頻
    save(video_url=video_url)
print('花費(fèi)時(shí)間:', time.time() - start_time)

到此這篇關(guān)于Python 短視頻爬蟲教程的文章就介紹到這了,更多相關(guān)Python 爬蟲教程內(nèi)容請搜索腳本之家以前的文章或繼續(xù)瀏覽下面的相關(guān)文章希望大家以后多多支持腳本之家!

相關(guān)文章

  • Python?eval()和exec()函數(shù)使用詳解

    Python?eval()和exec()函數(shù)使用詳解

    exec函數(shù)執(zhí)行的是python語句,沒有返回值,eval函數(shù)執(zhí)行的是python表達(dá)式,有返回值,exec函數(shù)和eval函數(shù)都可以傳入命名空間作為參數(shù),本文給大家介紹下Python?eval()和exec()函數(shù),感興趣的朋友跟隨小編一起看看吧
    2022-11-11
  • pytorch cnn 識別手寫的字實(shí)現(xiàn)自建圖片數(shù)據(jù)

    pytorch cnn 識別手寫的字實(shí)現(xiàn)自建圖片數(shù)據(jù)

    這篇文章主要介紹了pytorch cnn 識別手寫的字實(shí)現(xiàn)自建圖片數(shù)據(jù),小編覺得挺不錯(cuò)的,現(xiàn)在分享給大家,也給大家做個(gè)參考。一起跟隨小編過來看看吧
    2018-05-05
  • 淺談Python中數(shù)據(jù)解析

    淺談Python中數(shù)據(jù)解析

    本文給大家介紹的是Python中的數(shù)據(jù)解析的集中方式,包括列表解析、字典解析、集合解析,并附上相關(guān)示例,有需要的小伙伴可以參考下。
    2015-05-05
  • python實(shí)現(xiàn)對服務(wù)器腳本敏感信息的加密解密功能

    python實(shí)現(xiàn)對服務(wù)器腳本敏感信息的加密解密功能

    這篇文章主要介紹了python實(shí)現(xiàn)對服務(wù)器腳本敏感信息的加密解密功能,本文給大家介紹的非常詳細(xì),具有一定的參考借鑒價(jià)值,需要的朋友可以參考下
    2019-08-08
  • 詳解Python3中的 input() 函數(shù)

    詳解Python3中的 input() 函數(shù)

    這篇文章主要介紹了詳解Python3中的 input() 函數(shù)的相關(guān)知識,本文給大家介紹的非常詳細(xì),對大家的學(xué)習(xí)或工作具有一定的參考借鑒價(jià)值 ,需要的朋友可以參考下
    2020-03-03
  • 關(guān)于python中plt.hist參數(shù)的使用詳解

    關(guān)于python中plt.hist參數(shù)的使用詳解

    今天小編就為大家分享一篇關(guān)于python中plt.hist參數(shù)的使用詳解,具有很好的參考價(jià)值,希望對大家有所幫助。一起跟隨小編過來看看吧
    2019-11-11
  • python利用正則表達(dá)式排除集合中字符的功能示例

    python利用正則表達(dá)式排除集合中字符的功能示例

    在正則表達(dá)式里,想匹配一些字符中的一個(gè),也就是說給出一個(gè)字符的集合,只要出現(xiàn)這個(gè)集合里任意的字符,都是成立的,下面這篇文章主要給大家介紹了關(guān)于python利用正則表達(dá)式排除集合中字符功能的相關(guān)資料,需要的朋友可以參考下。
    2017-10-10
  • Python+樹莓派+YOLO打造一款人工智能照相機(jī)

    Python+樹莓派+YOLO打造一款人工智能照相機(jī)

    今天,我們將自己動(dòng)手打造出一款基于深度學(xué)習(xí)的照相機(jī),當(dāng)小鳥出現(xiàn)在攝像頭畫面中時(shí),它將能檢測到小鳥并自動(dòng)進(jìn)行拍照
    2018-01-01
  • 詳解如何減少python內(nèi)存的消耗

    詳解如何減少python內(nèi)存的消耗

    這篇文章主要介紹了詳解如何減少python內(nèi)存的消耗,文中通過示例代碼介紹的非常詳細(xì),對大家的學(xué)習(xí)或者工作具有一定的參考學(xué)習(xí)價(jià)值,需要的朋友們下面隨著小編來一起學(xué)習(xí)學(xué)習(xí)吧
    2019-08-08
  • 通過代碼實(shí)例了解Python異常本質(zhì)

    通過代碼實(shí)例了解Python異常本質(zhì)

    這篇文章主要介紹了通過代碼實(shí)例了解Python1異常本質(zhì),文中通過示例代碼介紹的非常詳細(xì),對大家的學(xué)習(xí)或者工作具有一定的參考學(xué)習(xí)價(jià)值,需要的朋友可以參考下
    2020-09-09

最新評論