欧美bbbwbbbw肥妇,免费乱码人妻系列日韩,一级黄片

python登錄并爬取淘寶信息代碼示例

 更新時間:2017年12月09日 14:27:40   作者:小奇葩  
這篇文章主要介紹了python 登錄并爬取淘寶信息代碼示例,具有一定借鑒價值,需要的朋友可以了解下。

本文主要分享關(guān)于python登錄并爬取淘寶信息的相關(guān)代碼,還是挺不錯的,大家可以了解下。

#!/usr/bin/env python 
# -*- coding:utf-8 -*- 
from selenium import webdriver 
import time 
import datetime 
import traceback 
import logging 
import os 
from selenium.webdriver.common.action_chains import ActionChains 
import codecs 
#登錄 
def login(driver,site): 
 driver.get(site) 
 time.sleep(5) 
 try: 
  #點(diǎn)擊請登錄 
  driver.find_element_by_class_name("h").click() 
  time.sleep(5) 
  #輸入賬號和密碼 
  driver.find_element_by_id("TPL_username_1").send_keys(u"yourusername") 
  time.sleep(5) 
  #print driver.find_element_by_id("TPL_username_1") 
  driver.find_element_by_id("TPL_password_1").send_keys(u"yourpsd") 
  time.sleep(5) 
 
  #點(diǎn)擊登錄 
  driver.find_element_by_id("J_SubmitStatic").click() 
  time.sleep(30) 
 except: 
  print u"failure" 
def crawlmarket(driver,filename,site): 
 #driver = webdriver.Firefox() 
 driver.get(site) 
 driver.maximize_window() 
 time.sleep(10) 
 driver.refresh() 
 time.sleep(10) 
 test = driver.find_elements_by_xpath("http://a[@class='J_ItemLink']") 
 #是否獲取到消息,若無則登錄 
 if len(test)==0: 
  login(driver,site) 
 time.sleep(30) 
 resultstrall="" 
 resultstr="" 
 strinfo ="" 
 for i in range(0,len(test),1): 
  if test[i].text != "" : 
   resultstr = test[i].text.strip()+'\n' 
   print resultstr 
   resultstrall += resultstr 
 #是否成功抓取 
 if resultstrall !="": 
  f = codecs.open(filename,'w','utf-8') 
  f.write(resultstrall) 
  f.close() 
 #若沒有成功抓取將網(wǎng)站寫入error 
 else: 
  strinfo = filename+","+site 
  print strinfo 
  ferror = codecs.open("error.txt",'a','utf-8') 
  ferror.write(strinfo) 
  ferror.close() 
 driver.quit() 

def crawltaobaosousuo(driver,filename,site): 
 #driver = webdriver.Firefox() 
 driver.get(site) 
 driver.maximize_window() 
 time.sleep(10) 
 driver.get(site) 
 time.sleep(30) 
 driver.refresh() 
 test = driver.find_elements_by_xpath("http://a[@class='J_ClickStat']") 
 resultstrall="" 
 resultstr="" 
 strinfo ="" 
 for i in range(0,len(test),1): 
  if test[i].text != "" : 
   resultstr = test[i].text.strip()+'\n' 
   print resultstr 
   resultstrall += resultstr 
 if resultstrall !="": 
  f = codecs.open(filename,'w','utf-8') 
  f.write(resultstrall) 
  f.close() 
 else: 
  strinfo = filename+","+site 
  print strinfo 
  ferror = codecs.open("error.txt",'a','utf-8') 
  ferror.write(strinfo) 
  ferror.close() 
 driver.quit() 
def jiexi(driver): 
 f = open("1.txt","r") 
 for line in f: 
  time.sleep(60) 
  info = line.split(",") 
  href = info[1] 
  filename = info[0].decode("utf-8") 
  print filename 
  if "markets" in href: 
   crawlmarket(driver,filename,href) 
  else: 
   crawltaobaosousuo(driver,filename,href) 
if __name__ =='__main__': 
 driver = webdriver.Firefox() 
 jiexi(driver) 

小結(jié)

有改進(jìn)策略一起探討,可以抓取淘寶部分網(wǎng)頁內(nèi)容,根據(jù)自己的需求改改吧,會被風(fēng)控。個人覺得不登錄的效果更好。

以上就是本文關(guān)于python 登錄并爬取淘寶信息代碼示例的全部內(nèi)容,希望對大家有所幫助。感興趣的朋友可以繼續(xù)參閱本站其他相關(guān)專題。如有不足之處,歡迎留言指出。感謝朋友們對本站的支持!

相關(guān)文章

  • 用Python selenium實(shí)現(xiàn)淘寶搶單機(jī)器人

    用Python selenium實(shí)現(xiàn)淘寶搶單機(jī)器人

    今天給大家?guī)淼氖顷P(guān)于Python實(shí)戰(zhàn)的相關(guān)知識,文章圍繞著用Python selenium實(shí)現(xiàn)淘寶搶單機(jī)器人展開,文中有非常詳細(xì)的介紹及代碼示例,需要的朋友可以參考下
    2021-06-06
  • 基于Python實(shí)現(xiàn)自動化文檔整理工具

    基于Python實(shí)現(xiàn)自動化文檔整理工具

    一個人可能會在計(jì)算機(jī)上存儲大量的照片、視頻和文檔文件,這些文件可能散落在不同的文件夾中,難以管理和查找。所以本文就來用Python制作一個自動化文檔整理工具吧
    2023-04-04
  • Python連接HDFS實(shí)現(xiàn)文件上傳下載及Pandas轉(zhuǎn)換文本文件到CSV操作

    Python連接HDFS實(shí)現(xiàn)文件上傳下載及Pandas轉(zhuǎn)換文本文件到CSV操作

    這篇文章主要介紹了Python連接HDFS實(shí)現(xiàn)文件上傳下載及Pandas轉(zhuǎn)換文本文件到CSV操作,具有很好的參考價值,希望對大家有所幫助。一起跟隨小編過來看看吧
    2020-06-06
  • 使用XML庫的方式,實(shí)現(xiàn)RPC通信的方法(推薦)

    使用XML庫的方式,實(shí)現(xiàn)RPC通信的方法(推薦)

    下面小編就為大家?guī)硪黄褂肵ML庫的方式,實(shí)現(xiàn)RPC通信的方法(推薦)。小編覺得挺不錯的,現(xiàn)在就分享給大家,也給大家做個參考。一起跟隨小編過來看看吧
    2017-06-06
  • python 性能提升的幾種方法

    python 性能提升的幾種方法

    本篇文章主要介紹python 性能提升的幾種方法,并附有代碼參考示例,有需要的小伙伴可以參考下
    2016-07-07
  • python中@符號實(shí)例詳解

    python中@符號實(shí)例詳解

    @是一個裝飾器,針對函數(shù),起調(diào)用傳參的作用,下面這篇文章主要給大家介紹了關(guān)于python中@符號的相關(guān)資料,文中通過示例代碼介紹的非常詳細(xì),需要的朋友可以參考下
    2022-12-12
  • Python timeit模塊原理及使用方法

    Python timeit模塊原理及使用方法

    這篇文章主要介紹了Python timeit模塊原理及使用方法,文中通過示例代碼介紹的非常詳細(xì),對大家的學(xué)習(xí)或者工作具有一定的參考學(xué)習(xí)價值,需要的朋友可以參考下
    2020-10-10
  • PyQt5+Pycharm安裝和配置圖文教程詳解

    PyQt5+Pycharm安裝和配置圖文教程詳解

    這篇文章主要介紹了PyQt5+Pycharm安裝和配置教程,本文通過圖文并茂的形式給大家介紹的非常詳細(xì),對大家的學(xué)習(xí)或工作具有一定的參考借鑒價值,需要的朋友可以參考下
    2020-03-03
  • python中實(shí)現(xiàn)定時任務(wù)的幾種方案

    python中實(shí)現(xiàn)定時任務(wù)的幾種方案

    本文呢給大家總結(jié)以下幾種方案實(shí)現(xiàn)定時任務(wù),可根據(jù)不同需求去使用不同方案,文章通過代碼示例介紹的非常詳細(xì),具有一定的參考價值,感興趣的小伙伴可以參考下
    2023-10-10
  • Python的對象傳遞與Copy函數(shù)使用詳解

    Python的對象傳遞與Copy函數(shù)使用詳解

    今天小編就為大家分享一篇Python的對象傳遞與Copy函數(shù)使用詳解,具有很好的參考價值,希望對大家有所幫助。一起跟隨小編過來看看吧
    2019-12-12

最新評論