Python3.x爬蟲下載網(wǎng)頁圖片的實例講解

更新時間：2018年05月22日 14:21:29 作者：hanchaobiao

今天小編就為大家分享一篇Python3.x爬蟲下載網(wǎng)頁圖片的實例講解，具有很好的參考價值，希望對大家有所幫助。一起跟隨小編過來看看吧

一、選取網(wǎng)址進行爬蟲

本次我們選取pixabay圖片網(wǎng)站

url=https://pixabay.com/

二、選擇圖片右鍵選擇查看元素來尋找圖片鏈接的規(guī)則

通過查看多個圖片路徑我們發(fā)現(xiàn)取src路徑都含有 https://cdn.pixabay.com/photo/ 公共部分且圖片格式都為.jpg 因此正則表達式為

re.compile(r'^https://cdn.pixabay.com/photo/.*?jpg$')

通過以上的分析我們可以開始寫程序了

#-*- coding:utf-8 -*-
import re
import requests
import os
from bs4 import BeautifulSoup

url = 'https://pixabay.com/'
html = requests.get(url).text #獲取網(wǎng)頁內(nèi)容
print(html)
# 這里由于有些圖片可能存在網(wǎng)址打不開的情況，加個5秒超時控制。
#data-objurl="http://pic38.nipic.com/20140218/17995031_091821599000_2.jpg"獲取這種類型鏈接
soup = BeautifulSoup(html,'html.parser',from_encoding='utf-8')
#^abc.*?qwe$
pic_url = soup.find_all('img',src=re.compile(r'^https://cdn.pixabay.com/photo/.*?jpg$'))
#pic_url = pic_node.get_text()
#pic_url = re.findall('"https://cdn.pixabay.com/photo/""(.*?)",',html,re.S)
print(pic_url)
i = 0
#判斷image文件夾是否存在，不存在則創(chuàng)建
if not os.path.exists('image'):
 os.makedirs('image')
for url in pic_url:
 img = url['src']
 try:
 pic = requests.get(img,timeout=5) #超時異常判斷 5秒超時
 except requests.exceptions.ConnectionError:
 print('當前圖片無法下載')
 continue
 file_name = "image/"+str(i)+".jpg" #拼接圖片名
 print(file_name)
 #將圖片存入本地
 fp = open(file_name,'wb')
 fp.write(pic.content) #寫入圖片
 fp.close()
 i+=1

代碼是不是很簡單呢如果你想修改地址取爬取別的網(wǎng)站請注意分析下載圖片路徑的共性并設計合理的正則表達式，否則是無法獲取到圖片路徑的

執(zhí)行過程截圖：

以上這篇Python3.x爬蟲下載網(wǎng)頁圖片的實例講解就是小編分享給大家的全部內(nèi)容了，希望能給大家一個參考，也希望大家多多支持腳本之家。

您可能感興趣的文章:

Python利用Turtle庫繪制一顆櫻花樹
后唐李煜曾說道，櫻花落盡春將困，秋千架下歸時。漏暗斜月遲遲，花在枝。櫻花落盡的時候春天也將過去了，秋千架下歸去時。天上的斜月姍姍來遲，花還在枝頭。本文將用Python+Turtle繪制一顆櫻花樹，感興趣的可以嘗試一下
2022-04-04
Python下載商品數(shù)據(jù)并連接數(shù)據(jù)庫且保存數(shù)據(jù)
這篇文章主要介紹了Python下載商品數(shù)據(jù)并連接數(shù)據(jù)庫且保存數(shù)據(jù)，包括發(fā)送請求、獲取數(shù)據(jù)、解析數(shù)據(jù)(篩選數(shù)據(jù))、保存數(shù)據(jù)、連接數(shù)據(jù)庫等內(nèi)容，需要的小伙伴可以參考一下
2022-03-03
python里大整數(shù)相乘相關技巧指南
對于大整數(shù)計算，一般都要用某種方法轉(zhuǎn)化，否則會溢出。但是python無此擔憂了。Python支持“無限精度”的整數(shù)，一般情況下不用考慮整數(shù)溢出的問題，而且Python Int類型與任意精度的Long整數(shù)類可以無縫轉(zhuǎn)換，超過Int 范圍的情況都將轉(zhuǎn)換成Long類型。
2014-09-09
python生成任意頻率正弦波方式
今天小編就為大家分享一篇python生成任意頻率正弦波方式，具有很好的參考價值，希望對大家有所幫助。一起跟隨小編過來看看吧
2020-02-02
python版單鏈表反轉(zhuǎn)
這篇文章主要為大家詳細介紹了python版單鏈表反轉(zhuǎn)，文中示例代碼介紹的非常詳細，具有一定的參考價值，感興趣的小伙伴們可以參考一下
2022-05-05
python腳本實現(xiàn)mp4中的音頻提取并保存在原目錄
這篇文章主要介紹了python腳本實現(xiàn)mp4中的音頻提取并保存在原目錄,本文給大家通過實例代碼介紹的非常詳細，具有一定的參考借鑒價值，需要的朋友可以參考下
2020-02-02
python 隨機數(shù)生成的代碼的詳細分析
如果你對python隨機數(shù)生成的實際應用有不解之處，你就可以通過以下的內(nèi)容對其進行了解，以下十九相關內(nèi)容的介紹
2011-05-05
pyinstaller打包opencv和numpy程序運行錯誤解決
這篇文章主要介紹了pyinstaller打包opencv和numpy程序運行錯誤解決,文中通過示例代碼介紹的非常詳細，對大家的學習或者工作具有一定的參考學習價值,需要的朋友可以參考下
2019-08-08
簡單了解Django應用app及分布式路由
這篇文章主要介紹了簡單了解Django應用app及分布式路由,文中通過示例代碼介紹的非常詳細，對大家的學習或者工作具有一定的參考學習價值,需要的朋友可以參考下
2019-07-07
Python股票開源庫akshare的具體使用
AKShare是一個開源財經(jīng)數(shù)據(jù)接口庫,本文主要介紹了Python股票開源庫akshare的具體使用,具有一定的參考價值,感興趣的可以了解一下
2024-04-04