python基于BeautifulSoup實現(xiàn)抓取網(wǎng)頁指定內(nèi)容的方法
更新時間:2015年07月09日 10:12:50 作者:光索與諾
這篇文章主要介紹了python基于BeautifulSoup實現(xiàn)抓取網(wǎng)頁指定內(nèi)容的方法,涉及Python使用BeautifulSoup模塊解析html網(wǎng)頁的相關(guān)技巧,具有一定參考借鑒價值,需要的朋友可以參考下
本文實例講述了python基于BeautifulSoup實現(xiàn)抓取網(wǎng)頁指定內(nèi)容的方法。分享給大家供大家參考。具體實現(xiàn)方法如下:
# _*_ coding:utf-8 _*_ #xiaohei.python.seo.call.me:) #win+python2.7.x import urllib2 from bs4 import BeautifulSoup def jd(url): page = urllib2.urlopen(url) html_doc = page.read() soup = BeautifulSoup(html_doc.decode('gb2312','ignore')) for i in soup.find_all('div', id="sortlist"): one = i.find_all('a') two = i.find_all('li') print ("%s %s" % (one,two)) jd("http://channel.jd.com/computer.html")
希望本文所述對大家的Python程序設(shè)計有所幫助。
您可能感興趣的文章:
- Python使用BeautifulSoup提取網(wǎng)頁數(shù)據(jù)的完整指南
- Python使用BeautifulSoup和Scrapy抓取網(wǎng)頁數(shù)據(jù)的具體教程
- Python使用BeautifulSoup抓取和解析網(wǎng)頁數(shù)據(jù)的操作方法
- Python利用BeautifulSoup解析網(wǎng)頁內(nèi)容
- Python爬蟲之使用BeautifulSoup和Requests抓取網(wǎng)頁數(shù)據(jù)
- Python如何使用BeautifulSoup爬取網(wǎng)頁信息
- Python通過BeautifulSoup抓取網(wǎng)頁數(shù)據(jù)并解析
相關(guān)文章
python email smtplib模塊發(fā)送郵件代碼實例
本篇文章給大家分享了python email smtplib模塊發(fā)送郵件的相關(guān)代碼分享,有需要的朋友參考學(xué)習(xí)下。2018-04-04python如何實現(xiàn)讀取并顯示圖片(不需要圖形界面)
這篇文章主要介紹了python如何實現(xiàn)讀取并顯示圖片,文中示例代碼非常詳細,幫助大家更好的理解和學(xué)習(xí),感興趣的朋友可以了解下2020-07-07Python進階學(xué)習(xí)之pandas中read_csv()用法詳解
python中數(shù)據(jù)處理是比較方便的,經(jīng)常用的就是讀寫文件,提取數(shù)據(jù)等,本文主要介紹其中的一些用法,這篇文章主要給大家介紹了關(guān)于Python進階學(xué)習(xí)之pandas中read_csv()用法的相關(guān)資料,需要的朋友可以參考下2024-03-03react中useLayoutEffect 和useEffect區(qū)別
本文主要介紹了react中useLayoutEffect 和useEffect區(qū)別,文中通過示例代碼介紹的非常詳細,具有一定的參考價值,感興趣的小伙伴們可以參考一下2021-12-12