python爬蟲教程之爬取百度貼吧并下載的示例
測試url:http://tieba.baidu.com/p/27141123322?pn=
begin 1
end 4
import string ,urllib2
def baidu_tieba(url,begin_page,end_page):
for i in range(begin_page, end_page+1):
sName = string.zfill(i,5)+ '.html'
print '正在下載第' + str(i) + '個網(wǎng)頁,并將其存儲為' + sName + '..........'
f = open (sName,'w+')
m = urllib2.urlopen(url + str(i)).read()
f.write(m)
f.close()
bdurl = str(raw_input('url: \n'))
begin_page = int(raw_input('begin :\n'))
end_page = int(raw_input('end : \n'))
baidu_tieba(bdurl,begin_page,end_page)
- Python實現(xiàn)爬取百度貼吧帖子所有樓層圖片的爬蟲示例
- 基于Python實現(xiàn)的百度貼吧網(wǎng)絡(luò)爬蟲實例
- 零基礎(chǔ)寫python爬蟲之抓取百度貼吧并存儲到本地txt文件改進版
- 零基礎(chǔ)寫python爬蟲之抓取百度貼吧代碼分享
- Python編寫百度貼吧的簡單爬蟲
- Python3實現(xiàn)爬取指定百度貼吧頁面并保存頁面數(shù)據(jù)生成本地文檔的方法
- Python爬取網(wǎng)頁中的圖片(搜狗圖片)詳解
- 簡單實現(xiàn)Python爬取網(wǎng)絡(luò)圖片
- Python爬蟲爬取一個網(wǎng)頁上的圖片地址實例代碼
- 利用Python爬取微博數(shù)據(jù)生成詞云圖片實例代碼
- Python實現(xiàn)的爬取百度貼吧圖片功能完整示例
相關(guān)文章
Python如何利用正則表達式爬取網(wǎng)頁信息及圖片
這篇文章主要給大家介紹了關(guān)于Python如何利用正則表達式爬取網(wǎng)頁信息及圖片的相關(guān)資料,文中通過示例代碼介紹的非常詳細,對大家的學(xué)習(xí)或者工作具有一定的參考學(xué)習(xí)價值,需要的朋友們下面隨著小編來一起學(xué)習(xí)學(xué)習(xí)吧2021-04-04Python中關(guān)于面向?qū)ο笾欣^承的詳細講解
面向?qū)ο缶幊?(OOP) 語言的一個主要功能就是“繼承”。繼承是指這樣一種能力:它可以使用現(xiàn)有類的所有功能,并在無需重新編寫原來的類的情況下對這些功能進行擴展2021-10-10解決List.append()?在?Python?中不起作用的問題
在?Python?中,我們通常使用?List.append()?方法向列表末尾添加元素,然而,在某些情況下,你可能會遇到?List.append()?方法不起作用的問題,本文將詳細討論這個問題并提供解決方法,需要的朋友可以參考下2023-06-06如何基于Python + requests實現(xiàn)發(fā)送HTTP請求
這篇文章主要介紹了如何基于Python + requests實現(xiàn)發(fā)送HTTP請求,文中通過示例代碼介紹的非常詳細,對大家的學(xué)習(xí)或者工作具有一定的參考學(xué)習(xí)價值,需要的朋友可以參考下2020-01-01