快捷導(dǎo)航

python抓取網(wǎng)頁中鏈接的靜態(tài)圖片

更新時間：2018年01月29日 11:45:46 作者：zoujm-hust12

這篇文章主要為大家詳細(xì)介紹了python抓取網(wǎng)頁中鏈接的靜態(tài)圖片，具有一定的參考價值，感興趣的小伙伴們可以參考一下

本文實例為大家分享了python抓取網(wǎng)頁中鏈接的靜態(tài)圖片的具體代碼，供大家參考，具體內(nèi)容如下

# -*- coding:utf-8 -*- 
 
#http://tieba.baidu.com/p/2460150866 
#抓取圖片地址 
 
from bs4 import BeautifulSoup 
import urllib.request 
from time import sleep 
 
html_doc = "http://tieba.baidu.com/p/2460150866" 
 
def get_image(url): 
 req = urllib.request.Request(url) 
 webpage = urllib.request.urlopen(req) 
 
 html = webpage.read() 
 soup = BeautifulSoup(html, 'html.parser') 
 
 #抓取圖片地址 
 #抓取img標(biāo)簽且class為BDE_Image的所有內(nèi)容 
 img_src=soup.findAll("img",{'class':'BDE_Image'}) 
 i = 1 
 for img in img_src: 
  img_url = img.get('src') #抓取src 
 # print(img) 
  req = urllib.request.Request(img_url) 
  u = urllib.request.urlopen(req) 
  data = u.read() 
  with open("AutoCodePng20180119-"+str(i)+".jpg", 'wb') as f: 
   sleep(2) 
   f.write(data) 
   i += 1 
 
def getImg(url): 
 html = urllib.request(url) 
 page = html.read() 
 soup = BeautifulSoup(page, "html.parser") 
 imglist = soup.find_all('img') #發(fā)現(xiàn)html中帶img標(biāo)簽的數(shù)據(jù)，輸出格式為<img xxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxx，存入集合 
 lenth = len(imglist) #計算集合的個數(shù) 
 for i in range(lenth): 
  print imglist[i].attrs['src'] #抓取img中屬性為src的信息,例如<img src="123456" xxxxxxxxxxxxxxxx,則輸出為123456

以上就是本文的全部內(nèi)容，希望對大家的學(xué)習(xí)有所幫助，也希望大家多多支持腳本之家。

您可能感興趣的文章:

相關(guān)文章

利用python設(shè)計圖像加密技術(shù)(Arnold算法)
這篇文章主要介紹了利用python設(shè)計圖像加密技術(shù)(Arnold算法)，本文將借助Arnold置亂法，講解如何用python從頭至尾設(shè)計出一套圖像加密算法，需要的小伙伴可以才參考一下
2022-03-03
Window系統(tǒng)下Python如何安裝OpenCV庫
這篇文章主要介紹了Window系統(tǒng)下Python如何安裝OpenCV庫，本文分步驟給大家介紹的詳細(xì)，對大家的學(xué)習(xí)或工作具有一定的參考借鑒價值,需要的朋友可以參考下
2020-03-03
Python Loguru輕松靈活的日志管理庫基本用法探索
Loguru是一個用于Python的高性能、簡潔且靈活的日志庫,它的目標(biāo)是提供一種簡單的方式來記錄應(yīng)用程序的運行情況,同時保持代碼的簡潔性和可讀性,本文將探索loguru的基本用法
2024-01-01
python執(zhí)行shell并獲取結(jié)果的詳細(xì)示例
在Python中執(zhí)行Shell命令并獲取其結(jié)果,通?？梢允褂胹ubprocess模塊,這個模塊允許我們啟動新的進(jìn)程,連接到它們的輸入/輸出/錯誤管道,并獲取它們的返回碼,下面是一個詳細(xì)的示例,展示了如何使用subprocess.run()函數(shù)來執(zhí)行Shell命令并獲取其輸出,需要的朋友可以參考下
2024-07-07
在Linux系統(tǒng)上通過uWSGI配置Nginx+Python環(huán)境的教程
這篇文章主要介紹了在Linux系統(tǒng)上通過uWSGI配置Nginx+Python環(huán)境的教程,示例中為Ubuntu系統(tǒng)并且默認(rèn)使用系統(tǒng)中自帶的Python解釋器,需要的朋友可以參考下
2015-12-12
python函數(shù)也可以是一個對象,可以存放在列表中并調(diào)用方式
這篇文章主要介紹了python函數(shù)也可以是一個對象,可以存放在列表中并調(diào)用方式,具有很好的參考價值,希望對大家有所幫助,如有錯誤或未考慮完全的地方,望不吝賜教
2024-02-02
使用python開發(fā)vim插件及心得分享
Vim 插件是一個 .vim 的腳本文件，定義了函數(shù)、映射、語法規(guī)則和命令，可用于操作窗口、緩沖以及行。一般一個插件包含了命令定義和事件鉤子。當(dāng)使用 Python 編寫 vim 插件時，函數(shù)外面是使用 VimL 編寫，盡管 VimL 學(xué)起來很快，但 Python 更加靈活
2014-11-11
詳解操作python容器的內(nèi)置通用函數(shù)
這篇文章主要為大家介紹了操作python容器的內(nèi)置通用函數(shù)，具有一定的參考價值，感興趣的小伙伴們可以參考一下，希望能夠給你帶來幫助
2021-12-12
Python實現(xiàn)子類調(diào)用父類的初始化實例
這篇文章主要介紹了Python實現(xiàn)子類調(diào)用父類的初始化實例，具有很好的參考價值，希望對大家有所幫助。一起跟隨小編過來看看吧
2020-03-03
$python入門字符串拼接\截取\轉(zhuǎn)數(shù)字理解學(xué)習(xí)$
python入門字符串拼接\截取\轉(zhuǎn)數(shù)字理解學(xué)習(xí)
本篇內(nèi)容我們主要講有關(guān)Python字符串的用法，包括字符串的拼接、字符串怎么轉(zhuǎn)數(shù)字、字符串的格式化、字符串函數(shù)等內(nèi)容,有需要的朋友可以借鑒參考下
2021-09-09