快捷導(dǎo)航

Python3簡單爬蟲抓取網(wǎng)頁圖片代碼實例

更新時間：2019年08月26日 11:52:16 作者：瀛洲過客

這篇文章主要介紹了Python3簡單爬蟲抓取網(wǎng)頁圖片代碼實例,文中通過示例代碼介紹的非常詳細(xì)，對大家的學(xué)習(xí)或者工作具有一定的參考學(xué)習(xí)價值,需要的朋友可以參考下

現(xiàn)在網(wǎng)上有很多python2寫的爬蟲抓取網(wǎng)頁圖片的實例，但不適用新手（新手都使用python3環(huán)境，不兼容python2），

所以我用Python3的語法寫了一個簡單抓取網(wǎng)頁圖片的實例，希望能夠幫助到大家，并希望大家批評指正。

import urllib.request
import re
import os
import urllib
#根據(jù)給定的網(wǎng)址來獲取網(wǎng)頁詳細(xì)信息，得到的html就是網(wǎng)頁的源代碼 
def getHtml(url):
  page = urllib.request.urlopen(url)
  html = page.read()
  return html.decode('UTF-8')

def getImg(html):
  reg = r'src="(.+?\.jpg)" pic_ext'
  imgre = re.compile(reg)
  imglist = imgre.findall(html)#表示在整個網(wǎng)頁中過濾出所有圖片的地址，放在imglist中
  x = 0
  path = 'D:\\test' 
  # 將圖片保存到D:\\test文件夾中，如果沒有test文件夾則創(chuàng)建
  if not os.path.isdir(path): 
    os.makedirs(path) 
  paths = path+'\\'   #保存在test路徑下 

  for imgurl in imglist: 
    urllib.request.urlretrieve(imgurl,'{0}{1}.jpg'.format(paths,x)) #打開imglist中保存的圖片網(wǎng)址，并下載圖片保存在本地，format格式化字符串 
    x = x + 1 
  return imglist
html = getHtml("http://tieba.baidu.com/p/2460150866")#獲取該網(wǎng)址網(wǎng)頁詳細(xì)信息，得到的html就是網(wǎng)頁的源代碼 
print (getImg(html)) #從網(wǎng)頁源代碼中分析并下載保存圖片

以上就是本文的全部內(nèi)容，希望對大家的學(xué)習(xí)有所幫助，也希望大家多多支持腳本之家。

您可能感興趣的文章:

相關(guān)文章

Python?seaborn數(shù)據(jù)可視化繪圖(直方圖,密度圖,散點(diǎn)圖)
這篇文章主要介紹了Python?seaborn數(shù)據(jù)可視化繪圖(直方圖,密度圖,散點(diǎn)圖)，文章圍繞主題展開詳細(xì)的內(nèi)容介紹，具有一定的參考價值，需要的朋友可以參考一下
2022-07-07
使用python進(jìn)行拆分大文件的方法
今天小編就為大家分享一篇使用python進(jìn)行拆分大文件的方法，具有很好的參考價值，希望對大家有所幫助。一起跟隨小編過來看看吧
2018-12-12
Flask?的路由Route詳情
在上一篇Flask?入門Web?微框架Hello?Flask中，我們用?Flask?框架寫了一個?Hello?Flask?應(yīng)用程序，我們了解到?Flask?框架簡潔高效、可以快速上手，接下來將對?Flask?框架的各項功能詳細(xì)的介紹一下，本篇文章介紹的是?Flask?的路由(Route),需要的朋友可以參考一下
2021-11-11
Python自動化實戰(zhàn)之接口請求的實現(xiàn)
本文為大家重點(diǎn)介紹如何通過 python 編碼來實現(xiàn)我們的接口測試以及通過Pycharm的實際應(yīng)用編寫一個簡單接口測試，感興趣的可以了解一下
2022-05-05
Python實現(xiàn)簡易凱撒密碼的示例代碼
密碼的使用最早可以追溯到古羅馬時期，《高盧戰(zhàn)記》有描述愷撒曾經(jīng)使用密碼來傳遞信息，即所謂的“愷撒密碼”。本文將利用Python實現(xiàn)簡易的凱撒密碼，感興趣的可以了解一下
2022-09-09
Python中的enumerate函數(shù)使用方法詳解
enumerate()是python的內(nèi)置函數(shù),適用于python2.x和python3.x,這篇文章主要給大家介紹了關(guān)于Python中的enumerate函數(shù)使用方法的相關(guān)資料,文中通過代碼介紹的非常詳細(xì),需要的朋友可以參考下
2024-06-06
Python面向?qū)ο笾腴T類和對象
這篇文章主要為大家介紹了Python入門類和對象，具有一定的參考價值，感興趣的小伙伴們可以參考一下，希望能夠給你帶來幫助
2021-12-12
用python簡單實現(xiàn)mysql數(shù)據(jù)同步到ElasticSearch的教程
今天小編就為大家分享一篇用python簡單實現(xiàn)mysql數(shù)據(jù)同步到ElasticSearch的教程，具有很好的參考價值，希望對大家有所幫助。一起跟隨小編過來看看吧
2018-05-05
python自動識別文本編碼格式代碼
今天小編就為大家分享一篇python自動識別文本編碼格式代碼，具有很好的參考價值，希望對大家有所幫助。一起跟隨小編過來看看吧
2019-12-12
Python字典的基本用法實例分析【創(chuàng)建、增加、獲取、修改、刪除】
這篇文章主要介紹了Python字典的基本用法,結(jié)合具體實例形式分析了Python字典的創(chuàng)建、增加、獲取、修改、刪除等基本操作技巧與注意事項,需要的朋友可以參考下
2019-03-03