python使用htmllib分析網(wǎng)頁內(nèi)容的方法
更新時間:2015年05月08日 11:39:53 作者:work24
這篇文章主要介紹了python使用htmllib分析網(wǎng)頁內(nèi)容的方法,涉及Python使用htmllib模塊的相關(guān)技巧,需要的朋友可以參考下
本文實例講述了python使用htmllib分析網(wǎng)頁內(nèi)容的方法。分享給大家供大家參考。具體實現(xiàn)方法如下:
import htmllib, urllib, formatter, sys website = urllib.urlopen("http://yourweb.com") data = website.read() website.close() format = formatter.AbstractFormatter(formatter.DumbWriter(sys.stdout)) ptext = htmllib.HTMLParser(format) ptext.feed(data) ptext.close()
希望本文所述對大家的Python程序設(shè)計有所幫助。
相關(guān)文章
scrapy+scrapyd+gerapy?爬蟲調(diào)度框架超詳細教程
Scrapy吸引人的地方在于它是一個框架,任何人都可以根據(jù)需求方便的修改。它也提供了多種類型爬蟲的基類,如BaseSpider、sitemap爬蟲等,最新版本又提供了web2.0爬蟲的支持,這篇文章主要介紹了scrapy+scrapyd+gerapy?爬蟲調(diào)度框架超詳細教程,需要的朋友可以參考下2022-06-06pandas組內(nèi)排序,并在每個分組內(nèi)按序打上序號的操作
這篇文章主要介紹了pandas組內(nèi)排序,并在每個分組內(nèi)按序打上序號的操作,具有很好的參考價值,希望對大家有所幫助。一起跟隨小編過來看看吧2021-03-03pandas數(shù)據(jù)清洗,排序,索引設(shè)置,數(shù)據(jù)選取方法
下面小編就為大家分享一篇pandas數(shù)據(jù)清洗,排序,索引設(shè)置,數(shù)據(jù)選取方法,具有很好的參考價值,希望對大家有所幫助。一起跟隨小編過來看看吧2018-05-05