快捷導(dǎo)航

python使用scrapy解析js示例

更新時間：2014年01月23日 10:06:22 作者：

這篇文章主要介紹了python使用scrapy解析js的示例，大家參考使用吧

from selenium import selenium

class MySpider(CrawlSpider):
    name = 'cnbeta'
    allowed_domains = ['cnbeta.com']
    start_urls = ['http://www.dbjr.com.cn']

    rules = (
        # Extract links matching 'category.php' (but not matching 'subsection.php')
        # and follow links from them (since no callback means follow=True by default).
        Rule(SgmlLinkExtractor(allow=('/articles/.*\.htm', )),
             callback='parse_page', follow=True),

# Extract links matching 'item.php' and parse them with the spider's method parse_item
)

    def __init__(self):
        CrawlSpider.__init__(self)
        self.verificationErrors = []
        self.selenium = selenium("localhost", 4444, "*firefox", "http://www.dbjr.com.cn")
        self.selenium.start()

    def __del__(self):
        self.selenium.stop()
        print self.verificationErrors
        CrawlSpider.__del__(self)

    def parse_page(self, response):
        self.log('Hi, this is an item page! %s' % response.url)
        sel = Selector(response)
        from webproxy.items import WebproxyItem

        sel = self.selenium
        sel.open(response.url)
        sel.wait_for_page_to_load("30000")
        import time

time.sleep(2.5)

您可能感興趣的文章:

scrapy

相關(guān)文章

python filecmp.dircmp實現(xiàn)遞歸比對兩個目錄的方法
這篇文章主要介紹了python filecmp.dircmp實現(xiàn)遞歸比對兩個目錄的方法，本文通過實例代碼給大家介紹的非常詳細，大家的學(xué)習(xí)或工作具有一定的參考借鑒價值,需要的朋友可以參考下
2020-05-05
PyTorch學(xué)習(xí)之軟件準(zhǔn)備與基本操作總結(jié)
這篇文章主要介紹了PyTorch學(xué)習(xí)之軟件準(zhǔn)備與基本操作總結(jié),文中有非常詳細的代碼示例,對正在學(xué)習(xí)python的小伙伴們有很好地幫助,需要的朋友可以參考下
2021-05-05
關(guān)于 Python opencv 使用中的 ValueError: too many values to unpack
這篇文章主要介紹了關(guān)于 Python opencv 使用中的 ValueError: too many values to unpack，小編覺得挺不錯的，現(xiàn)在分享給大家，也給大家做個參考。一起跟隨小編過來看看吧
2019-06-06
python cv2在驗證碼識別中應(yīng)用實例解析
這篇文章主要介紹了python cv2在驗證碼識別中應(yīng)用實例解析,文中通過示例代碼介紹的非常詳細，對大家的學(xué)習(xí)或者工作具有一定的參考學(xué)習(xí)價值,需要的朋友可以參考下
2019-12-12
Python利用魔法方法玩轉(zhuǎn)對象
Python中魔法方法（magic method）其實就是那些被雙下劃線包圍的方法,這些魔法方法為類添加了**“魔力”,讓我們可以在面向?qū)ο缶幊讨杏酶雍啙嵉拇a來操作對象,下面我們就來具體了解一下如何利用魔法方法玩轉(zhuǎn)對象吧
2023-12-12
python實現(xiàn)發(fā)送帶附件的郵件代碼分享
在本篇文章里小編給大家整理的是關(guān)于python實現(xiàn)發(fā)送帶附件的郵件代碼分享內(nèi)容，需要的朋友們可以參考下。
2020-09-09
python讀取excel表格生成erlang數(shù)據(jù)
這篇文章主要為大家詳細介紹了python讀取excel表格生成erlang數(shù)據(jù)，具有一定的參考價值，感興趣的小伙伴們可以參考一下
2017-08-08
淺談Python實現(xiàn)opencv之圖片色素的數(shù)值運算和邏輯運算
今天帶大家來學(xué)習(xí)的是關(guān)于Python的相關(guān)知識,文章圍繞著圖片色素的數(shù)值運算和邏輯運算展開,文中有非常詳細的的介紹及代碼示例,需要的朋友可以參考下
2021-06-06
Python中對象的引用與復(fù)制的使用
引用和復(fù)制是Python處理對象的重要概念,本文主要介紹了Python中對象的引用與復(fù)制的使用,文中通過示例代碼介紹的非常詳細,對大家的學(xué)習(xí)或者工作具有一定的參考學(xué)習(xí)價值,需要的朋友們下面隨著小編來一起學(xué)習(xí)學(xué)習(xí)吧
2023-12-12
python使用paramiko模塊通過ssh2協(xié)議對交換機進行配置的方法
今天小編就為大家分享一篇python使用paramiko模塊通過ssh2協(xié)議對交換機進行配置的方法，具有很好的參考價值，希望對大家有所幫助。一起跟隨小編過來看看吧
2019-07-07