欧美bbbwbbbw肥妇,免费乱码人妻系列日韩,一级黄片

python 淘寶爬蟲小實例

 更新時間:2021年11月08日 09:11:04   作者:嗨學編程  
雙十一即將到來,電商都在做活動打折,但打完折是不是真的優(yōu)惠了,需要我們自己斟酌,畢竟我們不能一直關(guān)注著價格,也自然不能知道現(xiàn)在的價格比以前高了還是低了,今天讓我們用Python來爬取一下淘寶吧

兄弟們,雙十一剁手了嗎?購物雖快樂,但是別過度了,畢竟很多降價不是真的降價,眼睛擦亮了~

在這里插入圖片描述

今天來試試爬一下某寶,這玩意學會了做外包的話,還是值幾個錢的。

在這里插入圖片描述

環(huán)境/模塊介紹

python 3.8 使用的環(huán)境
pycharm 使用的編輯器
selenium 瀏覽器驅(qū)動的第三方模塊
csv 數(shù)據(jù)保存的模塊
time 時間模塊, 可以用于程序的延遲
random 隨機數(shù)模塊

下載操作瀏覽器驅(qū)動的第三方模塊
對應(yīng)視頻教程:

Python:雙十火熱進行中,教你帶你用Python繼續(xù)剁手

selenium  pip install selenium

解釋我基本都寫在注釋了,我就偷個懶不在寫了。

from selenium import webdriver
import time  # 時間模塊, 可以用于程序的延遲
import random  # 隨機數(shù)模塊
from constants import TAO_USERNAME1, TAO_PASSWORD1
import csv  # 數(shù)據(jù)保存的模塊



def search_product(keyword):
    """搜索商品數(shù)據(jù), 登錄用戶"""
    driver.find_element_by_xpath('//*[@id="q"]').send_keys(keyword)
    time.sleep(random.randint(1, 3))  # 盡量避免人機檢測  隨機延遲

    driver.f
def parse_data():
    """解析商品數(shù)據(jù)"""
    divs = driver.find_elements_by_xpath('//div[@class="grid g-clearfx"]/div/div')  #  所有的div標簽

    for div in divs:
        try:
            info = div.find_element_by_xpath('.//div[@class="row row-2 title"]/a').text
            price = div.find_element_by_xpath('.//strong').text + '元'
            deal = div.find_element_by_xpath('.//div[@class="deal-cnt"]').text
            name = div.find_element_by_xpath('.//div[@class="shop"]/a/span[2]').text
            location = div.find_element_by_xpath('.//div[@class="location"]').te'.//div[@class="pic"]/a').get_attribute('href')

            print(info, price, deal, name, location, detail_url)

            # 保存
            with open('某寶.csv', mode='a', encoding='utf-8', newline='') as f:
                csv_write = csv.writer(f)
                csv_write.writerow([info, price, deal, name, location, detail_url])
        except:
            continue


word = input('請輸入你要搜索商品的關(guān)鍵字:')
# 創(chuàng)建一個瀏覽器
driver = webdriver.Chrome()

# selenium操作的瀏覽器被識別了, 無法登錄
# 修改瀏覽器的部分屬性, 繞過檢測
driver.execute_cdp_cmd("Page.addScriptToEvaluateOnNewDocument",
            {"source": """Object.defineProperty(navigator, 'webdriver', {get: () => false})"""})


# 執(zhí)行自動化瀏覽器的操作
driver.get('https://www.taobao.com/')
driver.implicitly_wait(10)  # 設(shè)置瀏覽器的等待,加載數(shù)據(jù)
driver.maximize_window()  # 最大化瀏覽器


# 調(diào)用商品搜索的函數(shù)
search_product(word)

for page in range(100): # 012
    print(f'\n==================正在抓取第{page + 1}頁數(shù)據(jù)====================')
    url = f'https://s.taobao.com/search?q=%E5%B7%B4%E9%BB%8E%E4%B8%96%E5%AE%B6&s={page * 44}'
    # 解析商品數(shù)據(jù)
    parse_data()
    time.sleep(random.randint(1, 3))  # 盡量避免人機檢測  隨機延遲

兄弟們快去試試吧!Python學習視頻,解答,電子書都可以私信我領(lǐng)取

到此這篇關(guān)于python 淘寶爬蟲小實例的文章就介紹到這了,更多相關(guān)python 淘寶爬蟲內(nèi)容請搜索腳本之家以前的文章或繼續(xù)瀏覽下面的相關(guān)文章希望大家以后多多支持腳本之家!

相關(guān)文章

  • Django中的模型類設(shè)計及展示示例詳解

    Django中的模型類設(shè)計及展示示例詳解

    這篇文章主要介紹了Django中的模型類設(shè)計及展示,本文通過實例代碼給大家介紹的非常詳細,對大家的學習或工作具有一定的參考借鑒價值,需要的朋友可以參考下
    2020-05-05
  • 使用Python開發(fā)個京東上搶口罩的小實例(僅作技術(shù)研究學習使用)

    使用Python開發(fā)個京東上搶口罩的小實例(僅作技術(shù)研究學習使用)

    這篇文章主要介紹了使用Python開發(fā)個京東上搶口罩的小實例(僅作技術(shù)研究學習使用),需要的朋友可以參考下
    2020-03-03
  • python數(shù)據(jù)庫如何連接SQLite詳解

    python數(shù)據(jù)庫如何連接SQLite詳解

    這篇文章主要介紹了Python實現(xiàn)連接SQLite數(shù)據(jù)庫的方法,在Python數(shù)據(jù)庫編程中有著廣泛的應(yīng)用,需要的朋友可以參考下,希望能給你帶來幫助
    2021-08-08
  • python matplotlib模塊基本圖形繪制方法小結(jié)【直線,曲線,直方圖,餅圖等】

    python matplotlib模塊基本圖形繪制方法小結(jié)【直線,曲線,直方圖,餅圖等】

    這篇文章主要介紹了python matplotlib模塊基本圖形繪制方法,結(jié)合實例形式總結(jié)分析了Python使用matplotlib模塊繪制直線,曲線,直方圖,餅圖等圖形的相關(guān)操作技巧,需要的朋友可以參考下
    2020-04-04
  • Python中的xml與dict的轉(zhuǎn)換方法詳解

    Python中的xml與dict的轉(zhuǎn)換方法詳解

    這篇文章主要介紹了Python中的xml與dict的轉(zhuǎn)換方法詳解,xml 是指可擴展標記語言,一種標記語言類似html,作用是傳輸數(shù)據(jù),而且不是顯示數(shù)據(jù)??梢宰远x標簽,需要的朋友可以參考下
    2023-07-07
  • Python實現(xiàn)的文軒網(wǎng)爬蟲完整示例

    Python實現(xiàn)的文軒網(wǎng)爬蟲完整示例

    這篇文章主要介紹了Python實現(xiàn)的文軒網(wǎng)爬蟲,結(jié)合完整實例形式分析了Python爬蟲爬取文軒網(wǎng)圖書信息的相關(guān)操作技巧,需要的朋友可以參考下
    2019-05-05
  • 最新評論