Python使用正則表達(dá)式抓取網(wǎng)頁圖片的方法示例
本文實(shí)例講述了Python使用正則表達(dá)式抓取網(wǎng)頁圖片的方法。分享給大家供大家參考,具體如下:
#!/usr/bin/python import re import urllib #獲取網(wǎng)頁信息 def getHtml(url): page = urllib.urlopen(url) html = page.read() return html def getImg(html): #匹配網(wǎng)頁中的圖片 reg = r'src="(.*?\.jpg)" alt' imgre = re.compile(reg) imglist = re.findall(imgre,html) x = 0 for imgurl in imglist: urllib.urlretrieve(imgurl,'%s.jpg' % x) x+=1 html = getHtml("http://photo.bitauto.com/?WT.mc_id=360tpdq") print getImg(html)
PS:這里再為大家提供2款非常方便的正則表達(dá)式工具供大家參考使用:
JavaScript正則表達(dá)式在線測試工具:
http://tools.jb51.net/regex/javascript
正則表達(dá)式在線生成工具:
http://tools.jb51.net/regex/create_reg
相關(guān)文章
python 讀文件,然后轉(zhuǎn)化為矩陣的實(shí)例
下面小編就為大家分享一篇python 讀文件,然后轉(zhuǎn)化為矩陣的實(shí)例,具有很好的參考價值,希望對大家有所幫助。一起跟隨小編過來看看吧2018-04-04最簡化ChatGLM2-6b小白部署教程【windows系統(tǒng),16G內(nèi)存即可,對顯卡無要求,CPU運(yùn)行】
這篇文章主要介紹了最簡化ChatGLM2-6b小白部署的方法,可以在windows系統(tǒng)環(huán)境下,16G內(nèi)存且對顯卡無要求,并以CPU模式運(yùn)行,方便實(shí)現(xiàn)個人PC機(jī)環(huán)境下的部署體驗(yàn),需要的朋友可以參考下2023-07-07Python hexstring-list-str之間的轉(zhuǎn)換方法
今天小編就為大家分享一篇Python hexstring-list-str之間的轉(zhuǎn)換方法,具有很好的參考價值,希望對大家有所幫助。一起跟隨小編過來看看吧2019-06-06python 文件的基本操作 菜中菜功能的實(shí)例代碼
這篇文章主要介紹了python 文件的基本操作 菜中菜功能,本文通過實(shí)例代碼給大家介紹的非常詳細(xì),具有一定的參考借鑒價值 ,需要的朋友可以參考下2019-07-07pygame學(xué)習(xí)筆記(2):畫點(diǎn)的三種方法和動畫實(shí)例
這篇文章主要介紹了pygame學(xué)習(xí)筆記(2):畫點(diǎn)的三種方法和動畫實(shí)例,本文講解了單個像素(畫點(diǎn))、連接多個點(diǎn)形成線、引用圖像、動畫完整實(shí)例,需要的朋友可以參考下2015-04-04