快捷導(dǎo)航

python爬蟲教程之爬取百度貼吧并下載的示例

更新時間：2014年03月07日 10:00:26 作者：

這篇文章主要介紹了python爬取百度貼吧整個html文件下載到本地的示例,需要的朋友可以參考下

測試url：http://tieba.baidu.com/p/27141123322?pn=
begin 1
end 4

import string ,urllib2

def baidu_tieba(url,begin_page,end_page):
    for i in range(begin_page, end_page+1):
        sName = string.zfill(i,5)+ '.html'
        print '正在下載第' + str(i) + '個網(wǎng)頁，并將其存儲為' + sName + '..........'
        f = open (sName,'w+')
        m = urllib2.urlopen(url + str(i)).read()
        f.write(m)
        f.close()

bdurl = str(raw_input('url： \n'))
begin_page = int(raw_input('begin :\n'))
end_page = int(raw_input('end : \n'))

baidu_tieba(bdurl,begin_page,end_page)

您可能感興趣的文章:

相關(guān)文章

Python如何利用正則表達(dá)式爬取網(wǎng)頁信息及圖片
這篇文章主要給大家介紹了關(guān)于Python如何利用正則表達(dá)式爬取網(wǎng)頁信息及圖片的相關(guān)資料，文中通過示例代碼介紹的非常詳細(xì)，對大家的學(xué)習(xí)或者工作具有一定的參考學(xué)習(xí)價值，需要的朋友們下面隨著小編來一起學(xué)習(xí)學(xué)習(xí)吧
2021-04-04
pygame 鍵盤事件的實踐
本文主要介紹了pygame 鍵盤事件，文中通過示例代碼介紹的非常詳細(xì)，具有一定的參考價值，感興趣的小伙伴們可以參考一下
2021-11-11
Python中關(guān)于面向?qū)ο笾欣^承的詳細(xì)講解
面向?qū)ο缶幊?(OOP) 語言的一個主要功能就是“繼承”。繼承是指這樣一種能力：它可以使用現(xiàn)有類的所有功能，并在無需重新編寫原來的類的情況下對這些功能進(jìn)行擴(kuò)展
2021-10-10
Django自定義分頁效果
這篇文章主要為大家詳細(xì)介紹了Django自定義分頁效果，具有一定的參考價值，感興趣的小伙伴們可以參考一下
2017-06-06
python求質(zhì)數(shù)列表的例子
今天小編就為大家分享一篇python求質(zhì)數(shù)列表的例子，具有很好的參考價值，希望對大家有所幫助。一起跟隨小編過來看看吧
2019-11-11
使用pytorch完成kaggle貓狗圖像識別方式
今天小編就為大家分享一篇使用pytorch完成kaggle貓狗圖像識別方式，具有很好的參考價值，希望對大家有所幫助。一起跟隨小編過來看看吧
2020-01-01
解決List.append()?在?Python?中不起作用的問題
在?Python?中，我們通常使用?List.append()?方法向列表末尾添加元素，然而，在某些情況下，你可能會遇到?List.append()?方法不起作用的問題，本文將詳細(xì)討論這個問題并提供解決方法，需要的朋友可以參考下
2023-06-06
如何基于Python + requests實現(xiàn)發(fā)送HTTP請求
這篇文章主要介紹了如何基于Python + requests實現(xiàn)發(fā)送HTTP請求,文中通過示例代碼介紹的非常詳細(xì)，對大家的學(xué)習(xí)或者工作具有一定的參考學(xué)習(xí)價值,需要的朋友可以參考下
2020-01-01
盤點總結(jié)Python爬蟲常用庫(附官方文檔)
在信息時代,數(shù)據(jù)是無處不在的寶藏,從網(wǎng)頁內(nèi)容、社交媒體帖子到在線商店的產(chǎn)品信息,互聯(lián)網(wǎng)上存在著大量的數(shù)據(jù)等待被收集和分析,Python爬蟲是一種強(qiáng)大的工具,用于從互聯(lián)網(wǎng)上獲取和提取數(shù)據(jù)
2023-11-11
python實現(xiàn)簡單文件讀寫函數(shù)
這篇文章主要為大家詳細(xì)介紹了python實現(xiàn)簡單文件讀寫函數(shù)，文中示例代碼介紹的非常詳細(xì)，具有一定的參考價值，感興趣的小伙伴們可以參考一下
2021-02-02