快捷導(dǎo)航

python爬蟲parsel-css選擇器的具體用法

更新時間：2023年06月28日 10:14:00 作者：就四個字，熟能生巧。

本文主要介紹了python爬蟲parsel-css選擇器的具體用法，文中通過示例代碼介紹的非常詳細(xì)，對大家的學(xué)習(xí)或者工作具有一定的參考學(xué)習(xí)價值，需要的朋友們下面隨著小編來一起學(xué)習(xí)學(xué)習(xí)吧

parsel 比 lxml 功能強(qiáng)大，它內(nèi)部不光集成有xpath語法，也集成了css和re語法，相比而言，css與re通用性更強(qiáng)，它倆的性能完全不輸xpath，特別是re，速度更快，難度也高！

引入

import parsel  
import requests

語法使用

url = 'http://www.baidu.com'
response = requests.get(url)
selector = parsel.Selector(response.text)

選擇所有元素

selector.css('*')

1、選擇article元素

html = selector.css('article')
# get(), getall() , extract_first(), extract() 都可以

2、選擇id為container的元素

selector.css('#container')

3、選擇所有class包含container的元素

selector.css('.container')

4、選取所有div下所有a元素

selector.css('div a')

5、提取標(biāo)簽title列表

title1 = selector.css('title').extract()
title2 = selector.css('title').extract_first()

6、提取標(biāo)簽p里的文本內(nèi)容

text = selector.css('p::text').extract()

7、提取標(biāo)簽div里的所有文本內(nèi)容

data = selector.css('div.post-content *::text').extract()

8、提取標(biāo)簽里的URL：標(biāo)簽名::attr(屬性名)

url = selector.css('div.post-content img::attr(src)').extract()

9、選取所有擁有title屬性的a元素

a = selector.css('a[title]').getall()

拓展語法

選取ul后面的第一個p元素

selector.css('ul + p')

選取與ul相鄰的所有p元素

selector.css('ul ~ p')

選取下面第二個標(biāo)簽，如果是a的話則選取，不是則不取

selector.css('a:nth-child(2)')

選取第偶數(shù)個a元素

selector.css('a:nth-child(2n)')

選取第奇數(shù)個a元素

selector.css('a:nth-child(2n+1)')

選取class為multi-chosen的li的所有a元素

selector.css('li.multi-chosen > a')

選取所有href屬性為www.baidu.com的a元素

selector.css('a[href=”www.baidu.com”]')

選取所有href屬性值中包含www.baidu.com的a元素

a[href*=”www.baidu.com”]

選取所有href屬性值中以http開頭的a元素

a[href^=”http”]

選取所有id為非content-container 的div

div:not(#content-container)

到此這篇關(guān)于python爬蟲parsel-css選擇器的具體用法的文章就介紹到這了,更多相關(guān)python parsel-css選擇器內(nèi)容請搜索腳本之家以前的文章或繼續(xù)瀏覽下面的相關(guān)文章希望大家以后多多支持腳本之家！

您可能感興趣的文章:

相關(guān)文章

Python中with及contextlib的用法詳解
這篇文章主要介紹了Python中with及contextlib的用法,結(jié)合實(shí)例形式較為詳細(xì)的分析了with及contextlib的功能、使用方法與相關(guān)注意事項(xiàng),需要的朋友可以參考下
2017-06-06
利用python獲取Ping結(jié)果示例代碼
這篇文章主要給大家介紹了關(guān)于利用python獲取Ping結(jié)果的相關(guān)資料，文中給出了詳細(xì)的示例代碼供大家參考學(xué)習(xí)，對大家具有一定的參考價值，需要的朋友們下面跟著小編一起來學(xué)習(xí)學(xué)習(xí)吧。
2017-07-07
Python基于yield遍歷多個可迭代對象
這篇文章主要介紹了Python基于yield遍歷多個可迭代對象,文中通過示例代碼介紹的非常詳細(xì)，對大家的學(xué)習(xí)或者工作具有一定的參考學(xué)習(xí)價值,需要的朋友可以參考下
2020-03-03
人臉識別實(shí)戰(zhàn)之Opencv+SVM實(shí)現(xiàn)人臉識別
這篇文章主要介紹了通過Opencv+SVM實(shí)現(xiàn)人臉識別功能，文中的示例代碼介紹詳細(xì)，對于我們學(xué)習(xí)人臉識別和OpenCV都有一定的幫助，感興趣的小伙伴可以學(xué)習(xí)一下
2021-12-12
Pycharm 操作Django Model的簡單運(yùn)用方法
今天小編就為大家分享一篇Pycharm 操作Django Model的簡單運(yùn)用方法，具有很好的參考價值，希望對大家有所幫助。一起跟隨小編過來看看吧
2018-05-05
PyGame貪吃蛇的實(shí)現(xiàn)代碼示例
貪吃蛇是款經(jīng)典游戲，本文將帶你一步步用python語言實(shí)現(xiàn)一個貪吃蛇小游戲，具有一定的參考價值，感興趣的小伙伴們可以參考一下
2018-11-11
Python實(shí)現(xiàn)視頻去抖動功能
視頻去抖動是視頻處理中的一項(xiàng)重要技術(shù),它可以有效地減少視頻中由于相機(jī)震動或手持拍攝等原因而導(dǎo)致的畫面抖動,提高視頻的質(zhì)量,本文將介紹如何利用 Python 中的 OpenCV 庫實(shí)現(xiàn)視頻去抖動的方法,并提供代碼實(shí)例,感興趣的朋友可以參考下
2024-04-04
Pytorch中求模型準(zhǔn)確率的兩種方法小結(jié)
這篇文章主要介紹了Pytorch中求模型準(zhǔn)確率的兩種方法小結(jié)，具有很好的參考價值，希望對大家有所幫助。如有錯誤或未考慮完全的地方，望不吝賜教
2021-05-05
python通配符之glob模塊的使用詳解
這篇文章主要介紹了python通配符之glob模塊的使用詳解，具有很好的參考價值，希望對大家有所幫助。一起跟隨小編過來看看吧
2021-04-04
Python利用imshow制作自定義漸變填充柱狀圖(colorbar)
這篇文章主要介紹了Python利用imshow制作自定義漸變填充柱狀圖(colorbar),文中通過示例代碼介紹的非常詳細(xì)，對大家的學(xué)習(xí)或者工作具有一定的參考學(xué)習(xí)價值，需要的朋友們下面隨著小編來一起學(xué)習(xí)學(xué)習(xí)吧
2020-12-12