快捷導(dǎo)航

python 爬蟲爬取京東ps4售賣情況

更新時(shí)間：2020年12月18日 10:51:45 作者：霧霾王者

這篇文章主要介紹了python 如何用爬蟲爬取京東ps4售賣情況，幫助大家更好的利用python爬取自己想要的數(shù)據(jù)，感興趣的朋友可以了解下

代碼

#!/usr/bin/env python
# -*- coding: utf-8 -*-
# @File : HtmlParser.py
# @Author: 趙路倉(cāng)
# @Date : 2020/3/17
# @Desc :
# @Contact : 398333404@qq.com
import json

from lxml import etree
import requests
from bs4 import BeautifulSoup


url="https://search.jd.com/Search?keyword=ps4&enc=utf-8&wq=ps4&pvid=cf0158c8664442799c1146a461478c9c"
head={
 'authority': 'search.jd.com',
 'method': 'GET',
 'path': '/s_new.php?keyword=%E6%89%8B%E6%9C%BA&enc=utf-8&qrst=1&rt=1&stop=1&vt=2&wq=%E6%89%8B%E6%9C%BA&cid2=653&cid3=655&page=4&s=84&scrolling=y&log_id=1529828108.22071&tpl=3_M&show_items=7651927,7367120,7056868,7419252,6001239,5934182,4554969,3893501,7421462,6577495,26480543553,7345757,4483120,6176077,6932795,7336429,5963066,5283387,25722468892,7425622,4768461',
 'scheme': 'https',
 'referer': 'https://search.jd.com/Search?keyword=%E6%89%8B%E6%9C%BA&enc=utf-8&qrst=1&rt=1&stop=1&vt=2&wq=%E6%89%8B%E6%9C%BA&cid2=653&cid3=655&page=3&s=58&click=0',
 'user-agent': 'Mozilla/5.0 (Windows NT 6.1; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/66.0.3359.139 Safari/537.36',
 'x-requested-with': 'XMLHttpRequest',
}

def page(page):
 print("開始")
 url = "https://search.jd.com/Search?keyword=ps4&enc=utf-8&qrst=1&rt=1&stop=1&vt=1&wq=ps4&page="+page+"&s=181&click=0"
 r=requests.get(url,timeout=3,headers=head)
 r.encoding=r.apparent_encoding
 # print(r.text)
 b=BeautifulSoup(r.text,"html.parser")
 #print(b.prettify())
 _element = etree.HTML(r.text)
 datas = _element.xpath('//li[contains(@class,"gl-item")]')
 print(datas)
 for data in datas:
  p_price = data.xpath('div/div[@class="p-price"]/strong/i/text()')
  p_comment = data.xpath('div/div[5]/strong/a/text()')
  p_name = data.xpath('div/div[@class="p-name p-name-type-2"]/a/em/text()')
  p_href = data.xpath('div/div[@class="p-name p-name-type-2"]/a/@href')
  comment=' '.join(p_comment)
  name = ' '.join(p_name)
  price = ' '.join(p_price)
  href = ' '.join(p_href)
  print(name,price,p_comment,href)

if __name__=="__main__":
 page("5")

爬取結(jié)果

以上就是python 爬蟲爬取某東ps4售賣情況的詳細(xì)內(nèi)容，更多關(guān)于python 爬蟲的資料請(qǐng)關(guān)注腳本之家其它相關(guān)文章！

您可能感興趣的文章:

相關(guān)文章

Python基礎(chǔ)之元類詳解
這篇文章主要介紹了Python基礎(chǔ)之元類詳解,文中有非常詳細(xì)的代碼示例,對(duì)正在學(xué)習(xí)python基礎(chǔ)的小伙伴們有非常好的幫助,需要的朋友可以參考下
2021-04-04
Python 腳本拉取 Docker 鏡像問(wèn)題
這篇文章主要介紹了 Python 腳本拉取 Docker 鏡像問(wèn)題，本文給大家介紹的非常詳細(xì)，具有一定的參考借鑒價(jià)值,需要的朋友可以參考下
2019-11-11
python實(shí)現(xiàn)一個(gè)點(diǎn)繞另一個(gè)點(diǎn)旋轉(zhuǎn)后的坐標(biāo)
今天小編就為大家分享一篇python實(shí)現(xiàn)一個(gè)點(diǎn)繞另一個(gè)點(diǎn)旋轉(zhuǎn)后的坐標(biāo)，具有很好的參考價(jià)值，希望對(duì)大家有所幫助。一起跟隨小編過(guò)來(lái)看看吧
2019-12-12
Python pandas實(shí)現(xiàn)excel工作表合并功能詳解
這篇文章主要介紹了Python pandas實(shí)現(xiàn)excel工作表合并功能以及相關(guān)實(shí)例代碼，需要的朋友們參考學(xué)習(xí)下。
2019-08-08
Python制作摩斯密碼翻譯器
摩斯密碼是一種將文本信息作為一系列通斷的音調(diào)、燈光或咔嗒聲傳輸?shù)姆椒?，本文將介紹如何通過(guò)Python制作摩斯密碼翻譯器，感興趣的童鞋可以關(guān)注一下
2021-11-11
python筆記（1）關(guān)于我們應(yīng)不應(yīng)該繼續(xù)學(xué)習(xí)python
關(guān)于Python，如果你要學(xué)習(xí)，建議大家查看一下網(wǎng)站：因?yàn)楸救艘彩莿倓倹Q定收集點(diǎn)零碎時(shí)間來(lái)學(xué)習(xí)下它，推薦可能并不是最好的
2012-10-10
DataFrame 數(shù)據(jù)合并實(shí)現(xiàn)(merge，join，concat)
這篇文章主要介紹了DataFrame 數(shù)據(jù)合并實(shí)現(xiàn)(merge，join，concat)，文中通過(guò)示例代碼介紹的非常詳細(xì)，對(duì)大家的學(xué)習(xí)或者工作具有一定的參考學(xué)習(xí)價(jià)值，需要的朋友們下面隨著小編來(lái)一起學(xué)習(xí)學(xué)習(xí)吧
2020-06-06
通過(guò)Python讀取照片的Exif信息解鎖圖片背后的故事
這篇文章主要為大家介紹了通過(guò)Python讀取照片的Exif信息解鎖圖片背后的故事探究,有需要的朋友可以借鑒參考下,希望能夠有所幫助,祝大家多多進(jìn)步,早日升職加薪
2023-12-12
Python中使用__new__實(shí)現(xiàn)單例模式并解析
單例模式是一個(gè)經(jīng)典設(shè)計(jì)模式，簡(jiǎn)要的說(shuō)，一個(gè)類的單例模式就是它只能被實(shí)例化一次，實(shí)例變量在第一次實(shí)例化時(shí)就已經(jīng)固定。這篇文章主要介紹了Python中使用__new__實(shí)現(xiàn)單例模式并解析 ,需要的朋友可以參考下
2019-06-06
python實(shí)現(xiàn)批量文件重命名
這篇文章主要介紹了python實(shí)現(xiàn)批量文件重命名，文中示例代碼介紹的非常詳細(xì)，具有一定的參考價(jià)值，感興趣的小伙伴們可以參考一下
2019-10-10