Python使用正則匹配實現(xiàn)抓圖代碼分享
更新時間:2015年04月02日 09:51:31 作者:ghoulangle
本文給大家分享的是個人的第一個作品,使用Python正則匹配實現(xiàn)抓圖代碼,非常的簡單實用,推薦給大家,小伙伴們可以自由擴展下。
內涵:正則匹配,正則替換,頁面抓取,圖片保存 。
實用的第一次 Python 代碼 參考
#!/usr/bin/env python import urllib import re x=0 def getHtml(url): page = urllib.urlopen(url) html = page.read() return html def getImg(html): global x reg = 'alt=".+?" src="(.+?\.jpg)"' imgre = re.compile(reg) imglist = re.findall(imgre,html) for imgurl in imglist: urllib.urlretrieve(re.sub(r',\d+,\d+',',800,450',imgurl),"img/%s.jpg" % x) print "\n"+re.sub(r',\d+,\d+',',800,450',imgurl)+"========"+"img/%s.jpg" % x x+=1 print 'Starting...' pages = range(1,9) for p in pages: html = getHtml('http://m.lovebizhi.com/category/7655/%d/' % p) print "\n-------------------------page:%d-------------------------------" % p getImg(html) print "\nDone!"
以上所述就是本文給大家分享的全部代碼了,本人Python菜鳥,第一個作品,希望對大家能有所幫助。
相關文章
Python+Pygame實現(xiàn)之走四棋兒游戲的實現(xiàn)
大家以前應該都聽說過一個游戲:叫做走四棋兒。直接在家里的水泥地上用燒完的炭火灰畫出幾條線,擺上幾顆石頭子即可。當時的火爆程度可謂是達到了一個新的高度。本文將利用Pygame實現(xiàn)這一游戲,需要的可以參考一下2022-07-07python格式化字符串的實戰(zhàn)教程(使用占位符、format方法)
我們經常會用到%-formatting和str.format()來格式化,下面這篇文章主要給大家介紹了關于python格式化字符串的相關資料,文中通過實例代碼介紹的非常詳細,需要的朋友可以參考下2022-08-08