快捷導(dǎo)航

python抓取京東商城手機(jī)列表url實(shí)例代碼

更新時(shí)間：2013年12月18日 15:25:21 作者：

python抓取京東商城手機(jī)列表url實(shí)例分享，大家參考使用吧

#-*- coding: UTF-8 -*-
'''
Created on 2013-12-5

@author: good-temper
'''

import urllib2
import bs4
import time

def getPage(urlStr):
    '''
                獲取頁(yè)面內(nèi)容
    '''
    content = urllib2.urlopen(urlStr).read()
    return content

def getNextPageUrl(currPageNum):
    #http://list.jd.com/9987-653-655-0-0-0-0-0-0-0-1-1-頁(yè)碼-1-1-72-4137-33.html
    url = u'http://list.jd.com/9987-653-655-0-0-0-0-0-0-0-1-1-'+str(currPageNum+1)+'-1-1-72-4137-33.html'

    #是否有下一頁(yè)
    content = getPage(url);
    soup = bs4.BeautifulSoup(content)
    list = soup.findAll('span',{'class':'next-disabled'});
    if(len(list) == 0):
        return url
    return ''

def analyzeList():
    pageNum = 0
    list = []
    url = getNextPageUrl(pageNum)
    while url !='':
        soup = bs4.BeautifulSoup(getPage(url))
        pagelist = soup.findAll('div',{'class':'p-name'})
        for elem in pagelist:
            soup1 = bs4.BeautifulSoup(str(elem))
            list.append(soup1.find('a')['href'])

        pageNum = pageNum+1
        print pageNum
        url = getNextPageUrl(pageNum)
    return list

def analyzeContent(url):

return ''

def writeToFile(list, path):
    f = open(path, 'a')
    for elem in list:
        f.write(elem+'\n')
    f.close()

if __name__ == '__main__':
    list = analyzeList()
    print '共抓取'+str(len(list))+'條\n'

    writeToFile(list, u'E:\\jd_phone_list.dat');

您可能感興趣的文章:

相關(guān)文章

python爬蟲(chóng)獲取多頁(yè)天涯帖子
本篇文章通過(guò)爬取多頁(yè)天涯帖子內(nèi)容來(lái)教給大家深入理解python爬蟲(chóng)相關(guān)知識(shí)，有興趣的參考學(xué)習(xí)下。
2018-02-02
Jupyter Notebook/VSCode導(dǎo)出PDF中文不顯示的解決
這篇文章主要介紹了Jupyter Notebook/VSCode導(dǎo)出PDF中文不顯示的解決方案，具有很好的參考價(jià)值，希望對(duì)大家有所幫助。如有錯(cuò)誤或未考慮完全的地方，望不吝賜教
2023-06-06
對(duì)Python+opencv將圖片生成視頻的實(shí)例詳解
今天小編就為大家分享一篇對(duì)Python+opencv將圖片生成視頻的實(shí)例詳解，具有很好的參考價(jià)值，希望對(duì)大家有所幫助。一起跟隨小編過(guò)來(lái)看看吧
2019-01-01
Python?Pygame實(shí)戰(zhàn)之打磚塊小游戲
打磚塊最早是由雅達(dá)利公司開(kāi)發(fā)的一款獨(dú)立游戲，也是無(wú)數(shù)人的童年記憶。本文將利用Python中的Pygame模塊制作經(jīng)典的打磚塊游戲，需要的可以參考一下
2022-02-02
Python使用pandasai實(shí)現(xiàn)數(shù)據(jù)分析
本文主要介紹了Python使用pandasai實(shí)現(xiàn)數(shù)據(jù)分析，文中通過(guò)示例代碼介紹的非常詳細(xì)，對(duì)大家的學(xué)習(xí)或者工作具有一定的參考學(xué)習(xí)價(jià)值，需要的朋友們下面隨著小編來(lái)一起學(xué)習(xí)學(xué)習(xí)吧
2023-06-06
這篇文章主要介紹了Python的面向?qū)ο笏枷敕治?以實(shí)例形式較為詳細(xì)的分析了封裝,繼承,多態(tài)的具體用法,具有一定參考借鑒價(jià)值,需要的朋友可以參考下
2015-01-01

在python image 中安裝中文字體的實(shí)現(xiàn)方法

今天小編大家分享一篇在python image 中安裝中文字體的實(shí)現(xiàn)方法，具有很好的參考價(jià)值，希望對(duì)大家有所幫助。一起跟隨小編過(guò)來(lái)看看吧

2019-08-08

Django實(shí)現(xiàn)翻頁(yè)的示例代碼

翻頁(yè)是經(jīng)常使用的功能，Django提供了翻頁(yè)器。用Django的Paginator類實(shí)現(xiàn)，有需要了解Paginator類用法的朋友可參考。希望此文章對(duì)各位有所幫助

2021-05-05

Python用棧實(shí)現(xiàn)隊(duì)列的基本操作

隊(duì)列（Queue）和棧（Stack）是常見(jiàn)的數(shù)據(jù)結(jié)構(gòu),它們?cè)谟?jì)算機(jī)科學(xué)中有著廣泛的應(yīng)用,在Python中,可以使用列表（List）來(lái)實(shí)現(xiàn)棧,但要用棧來(lái)實(shí)現(xiàn)隊(duì)列需要一些巧妙的操作,本文就給大家詳細(xì)介紹一下Python中如何用棧實(shí)現(xiàn)隊(duì)列,需要的朋友可以參考下

2023-11-11

Python寫的貪吃蛇游戲例子

這篇文章主要介紹了Python寫的貪吃蛇游戲例子,練手作品,又好玩又可以學(xué)到東西,需要的朋友可以參考下

2014-06-06

欧美bbbwbbbw肥妇,免费乱码人妻系列日韩,一级黄片

軟件下載

源碼下載

軟件編程

網(wǎng)絡(luò)編程

在線工具

數(shù)據(jù)庫(kù)

CMS

常用工具

python抓取京東商城手機(jī)列表url實(shí)例代碼

相關(guān)文章

最新評(píng)論

大家感興趣的內(nèi)容

最近更新的內(nèi)容

常用在線小工具