Python爬蟲爬取一個網(wǎng)頁上的圖片地址實(shí)例代碼
本文實(shí)例主要是實(shí)現(xiàn)爬取一個網(wǎng)頁上的圖片地址,具體如下。
讀取一個網(wǎng)頁的源代碼:
import urllib.request def getHtml(url): html=urllib.request.urlopen(url).read() return html print(getHtml(http://image.baidu.com/search/flip?tn=baiduimage&ie=utf-8&word=%E5%A3%81%E7%BA%B8&ct=201326592&lm=-1&v=flip))
利用正則表達(dá)式爬取一個網(wǎng)頁上的圖片地址:
import re
import urllib.request
def getHtml(url):
html=urllib.request.urlopen(url).read()
return html
def getImg(html):
r=r'"thumbURL":"(http://img.+?\.jpg)"' #定義正則
imglist=re.findall(r,html)
return imglist
html=str(getHtml("http://image.baidu.com/search/flip?tn=baiduimage&ie=utf-8&word=%E5%A3%81%E7%BA%B8&ct=201326592&lm=-1&v=flip"))
print(getImg(html))
運(yùn)行結(jié)果:

總結(jié)
以上就是本文關(guān)于Python爬蟲爬取一個網(wǎng)頁上的圖片地址實(shí)例代碼的全部內(nèi)容,希望對大家有所幫助。感興趣的朋友可以繼續(xù)參閱本站其他相關(guān)專題,如有不足之處,歡迎留言指出。感謝朋友們對本站的支持!
相關(guān)文章
Python基于動態(tài)規(guī)劃算法解決01背包問題實(shí)例
這篇文章主要介紹了Python基于動態(tài)規(guī)劃算法解決01背包問題,結(jié)合實(shí)例形式分析了Python動態(tài)規(guī)劃算法解決01背包問題的原理與具體實(shí)現(xiàn)技巧,需要的朋友可以參考下2017-12-12
python client使用http post 到server端的代碼
python client使用 http post 到server端的代碼,供大家學(xué)習(xí)參考2013-02-02
python基礎(chǔ)之單分派泛函數(shù)singledispatch
這篇文章主要介紹了python基礎(chǔ)之單分派泛函數(shù)singledispatch問題,具有很好的參考價(jià)值,希望對大家有所幫助,如有錯誤或未考慮完全的地方,望不吝賜教2023-08-08
Python數(shù)據(jù)類型轉(zhuǎn)換實(shí)現(xiàn)方法
這篇文章主要介紹了Python數(shù)據(jù)類型轉(zhuǎn)換的實(shí)現(xiàn),有時(shí)候,我們需要對數(shù)據(jù)內(nèi)置的類型進(jìn)行轉(zhuǎn)換,數(shù)據(jù)類型的轉(zhuǎn)換,一般情況下你只需要將數(shù)據(jù)類型作為函數(shù)名即可2022-12-12
python實(shí)現(xiàn)加密的方式總結(jié)
這篇文章主要介紹了python實(shí)現(xiàn)加密的方式總結(jié),文中給大家提到了python中加密的注意點(diǎn),通過實(shí)例代碼給大家介紹的非常詳細(xì),具有一定的參考借鑒價(jià)值,需要的朋友可以參考下2020-01-01

