Python Selenium自動化獲取頁面信息的方法
1.獲取頁面title
title:獲取當前頁面的標題顯示的字段
from selenium import webdriver import time browser = webdriver.Chrome() browser.get('https://www.baidu.com') #打印網頁標題 print(browser.title) #輸出內容:百度一下,你就知道
2.獲取頁面URL
current_url:獲取當前頁面的URL
from selenium import webdriver import time browser = webdriver.Chrome() browser.get('https://www.baidu.com') #打印網頁標題 print(browser.current_url) #輸出內容:https://www.baidu.com/
3.獲取瀏覽器版本號
capabilities['version']):打印瀏覽器version的值
from selenium import webdriver import time browser = webdriver.Chrome() browser.get('https://www.baidu.com') #打印網頁標題 print(browser.capabilities['version']) #輸出內容:67.0.3396.87
4.獲取元素尺寸
size:返回元素的尺寸
from selenium import webdriver import time browser = webdriver.Chrome() browser.get('https://www.baidu.com') #定位輸入框 input_box = browser.find_element_by_id('kw') #打印輸入框尺寸 print(input_box.size) #輸出內容:{'height': 22, 'width': 500}
5.獲取元素的文本
text:返回元素的文本信息
from selenium import webdriver import time browser = webdriver.Chrome() browser.get('https://www.baidu.com') #定位備案元素 recordcode = browser.find_element_by_id('jgwab') #打印備案元素信息 print(recordcode.text) #輸出內容:京公網安備11000002000001號
6.獲得屬性值
- get_attribute('')方法
- get_attribute('href'):獲取href屬性值
- get_attribute('id'):獲取id屬性值
# coding=utf-8 import time from selenium import webdriver driver = webdriver.Chrome() driver.maximize_window() driver.implicitly_wait(6) driver.get("https://www.baidu.com") time.sleep(1) for link in driver.find_elements_by_xpath("http://*[@href]"): print (link.get_attribute('href')) driver.quit()
到此這篇關于Python Selenium自動化獲取頁面信息的方法的文章就介紹到這了,更多相關Python Selenium 獲取頁面信息內容請搜索腳本之家以前的文章或繼續(xù)瀏覽下面的相關文章希望大家以后多多支持腳本之家!
相關文章
用gpu訓練好的神經網絡,用tensorflow-cpu跑出錯的原因及解決方案
這篇文章主要介紹了用gpu訓練好的神經網絡,用tensorflow-cpu跑出錯的原因及解決方案,具有很好的參考價值,希望對大家有所幫助。一起跟隨小編過來看看吧2021-03-03Python連接Oracle之環(huán)境配置、實例代碼及報錯解決方法詳解
這篇文章主要介紹了Python連接Oracle之環(huán)境配置、實例代碼及報錯解決方法詳解,需要的朋友可以參考下2020-02-02Python使用re模塊實現okenizer(表達式分詞器)
這篇文章主要介紹了Python使用re模塊實現okenizer,我們這里講解用正則表達式構建簡單的表達式分詞器(tokenizer),它能夠將表達式字符串從左到右解析為標記(tokens)流,需要的朋友可以參考下2022-04-04