Python使用正則匹配實現(xiàn)抓圖代碼分享
更新時間:2015年04月02日 09:51:31 作者:ghoulangle
本文給大家分享的是個人的第一個作品,使用Python正則匹配實現(xiàn)抓圖代碼,非常的簡單實用,推薦給大家,小伙伴們可以自由擴(kuò)展下。
內(nèi)涵:正則匹配,正則替換,頁面抓取,圖片保存 。
實用的第一次 Python 代碼 參考
#!/usr/bin/env python
import urllib
import re
x=0
def getHtml(url):
page = urllib.urlopen(url)
html = page.read()
return html
def getImg(html):
global x
reg = 'alt=".+?" src="(.+?\.jpg)"'
imgre = re.compile(reg)
imglist = re.findall(imgre,html)
for imgurl in imglist:
urllib.urlretrieve(re.sub(r',\d+,\d+',',800,450',imgurl),"img/%s.jpg" % x)
print "\n"+re.sub(r',\d+,\d+',',800,450',imgurl)+"========"+"img/%s.jpg" % x
x+=1
print 'Starting...'
pages = range(1,9)
for p in pages:
html = getHtml('http://m.lovebizhi.com/category/7655/%d/' % p)
print "\n-------------------------page:%d-------------------------------" % p
getImg(html)
print "\nDone!"
以上所述就是本文給大家分享的全部代碼了,本人Python菜鳥,第一個作品,希望對大家能有所幫助。
您可能感興趣的文章:
- python re模塊findall()函數(shù)實例解析
- Python 匹配任意字符(包括換行符)的正則表達(dá)式寫法
- Python匹配中文的正則表達(dá)式
- Python正則表達(dá)式匹配ip地址實例
- python正則表達(dá)式中的括號匹配問題
- python正則表達(dá)式去掉數(shù)字中的逗號(python正則匹配逗號)
- Python利用正則表達(dá)式匹配并截取指定子串及去重的方法
- python使用正則表達(dá)式匹配字符串開頭并打印示例
- python正則匹配抓取豆瓣電影鏈接和評論代碼分享
- Python3正則匹配re.split,re.finditer及re.findall函數(shù)用法詳解
相關(guān)文章
Python+Pygame實現(xiàn)之走四棋兒游戲的實現(xiàn)
大家以前應(yīng)該都聽說過一個游戲:叫做走四棋兒。直接在家里的水泥地上用燒完的炭火灰畫出幾條線,擺上幾顆石頭子即可。當(dāng)時的火爆程度可謂是達(dá)到了一個新的高度。本文將利用Pygame實現(xiàn)這一游戲,需要的可以參考一下2022-07-07
Python調(diào)用Zoomeye搜索接口的實現(xiàn)
本文主要介紹了Python調(diào)用Zoomeye搜索接口的實現(xiàn),文中通過示例代碼介紹的非常詳細(xì),對大家的學(xué)習(xí)或者工作具有一定的參考學(xué)習(xí)價值,需要的朋友們下面隨著小編來一起學(xué)習(xí)學(xué)習(xí)吧2023-01-01
Python3進(jìn)制之間的轉(zhuǎn)換代碼實例
這篇文章主要介紹了Python3進(jìn)制之間的轉(zhuǎn)換代碼實例,文中通過示例代碼介紹的非常詳細(xì),對大家的學(xué)習(xí)或者工作具有一定的參考學(xué)習(xí)價值,需要的朋友可以參考下2019-08-08
Python實現(xiàn)復(fù)制文檔數(shù)據(jù)
我們百度搜索一些東西得時候,經(jīng)常找到文檔里面然后就會發(fā)現(xiàn)需要充值才能復(fù)制!怎么可以不花錢也保存呢?今天就分享給大家一個python獲取文檔數(shù)據(jù)得方法,需要的可以收藏一下2022-12-12
python格式化字符串的實戰(zhàn)教程(使用占位符、format方法)
我們經(jīng)常會用到%-formatting和str.format()來格式化,下面這篇文章主要給大家介紹了關(guān)于python格式化字符串的相關(guān)資料,文中通過實例代碼介紹的非常詳細(xì),需要的朋友可以參考下2022-08-08

