Python獲取網(wǎng)頁上圖片下載地址的方法
更新時間:2015年03月11日 09:32:14 作者:saintatgod
這篇文章主要介紹了Python獲取網(wǎng)頁上圖片下載地址的方法,涉及Python操作正則表達(dá)式匹配字符串的技巧,需要的朋友可以參考下
本文實例講述了Python獲取網(wǎng)頁上圖片下載地址的方法。分享給大家供大家參考。具體如下:
這里獲取網(wǎng)頁上圖片的下載地址是正在寫的數(shù)據(jù)采集中的一段,代碼如下:
復(fù)制代碼 代碼如下:
#!/user/bin/python3
import urllib2
from HTMLParser import HTMLParser
class MyHtmlParser(HTMLParser):
links = []
def handle_starttag(self, tag, attrs):
if tag == "img":
if len(attrs) == 0:
pass
else:
for name, value in attrs:
if name == "src":
self.links.append(value)
if __name__ == "__main__":
uri = "http://dy.163.com/v2/article/T1374483113516/AGSNE9L000964K4O"
file = urllib2.urlopen(uri).read()
# file = "<html><h1>Title</h1><p>I'm a paragraph!</p></html>"
hy = MyHtmlParser()
hy.feed(file)
hy.close()
print(hy.links)
import urllib2
from HTMLParser import HTMLParser
class MyHtmlParser(HTMLParser):
links = []
def handle_starttag(self, tag, attrs):
if tag == "img":
if len(attrs) == 0:
pass
else:
for name, value in attrs:
if name == "src":
self.links.append(value)
if __name__ == "__main__":
uri = "http://dy.163.com/v2/article/T1374483113516/AGSNE9L000964K4O"
file = urllib2.urlopen(uri).read()
# file = "<html><h1>Title</h1><p>I'm a paragraph!</p></html>"
hy = MyHtmlParser()
hy.feed(file)
hy.close()
print(hy.links)
希望本文所述對大家的Python程序設(shè)計有所幫助。
相關(guān)文章
Python 統(tǒng)計字?jǐn)?shù)的思路詳解
這篇文章主要介紹了Python 統(tǒng)計字?jǐn)?shù)的思路詳解,文中還給大家提供了不借助第三方模塊的解決方法,感興趣的朋友一起看看吧2018-05-05基于Python Shell獲取hostname和fqdn釋疑
一直以來被linux的hostname和fqdn(Fully Qualified Domain Name)困惑著,今天通過腳本之家平臺把它們使用細(xì)節(jié)弄清分享給大家2016-01-01python光學(xué)仿真學(xué)習(xí)wxpython創(chuàng)建手速測試程序
這篇文章主要介紹了python光學(xué)仿真學(xué)習(xí)使用wxpython創(chuàng)建一個手速測試程序示例的實現(xiàn),有需要的朋友可以借鑒參考下,希望能夠有所幫助2021-10-10Python爬取當(dāng)當(dāng)、京東、亞馬遜圖書信息代碼實例
這篇文章主要介紹了Python爬取當(dāng)當(dāng)、京東、亞馬遜圖書信息代碼實例,具有一定借鑒價值,需要的朋友可以參考下。2017-12-12Python matplotlib畫圖實例之繪制擁有彩條的圖表
這篇文章主要介紹了Python matplotlib畫圖實例之繪制擁有彩條的圖表,具有一定借鑒價值,需要的朋友可以參考下2017-12-12