Selenium定位元素的方法小結及語法詳解

更新時間：2025年02月18日 09:49:15 作者：靜靜在思考

Selenium是一種用于自動化網頁操作的工具,通過不同定位策略可以精準定位網頁元素,本文介紹了8種定位方法,并詳細說明了每種方法的語法、使用場景及實際操作中的注意事項,需要的朋友可以參考下

1. 通過 ID 定位

語法：使用 By.ID 定位策略，在 Python 代碼里通過 find_element(By.ID, 'element_id') 來定位元素，其中 element_id 是網頁元素的 id 屬性值。
使用場景：適用于元素具有唯一 id 屬性的情況，定位準確且速度快。在百度搜索頁面，搜索框的 id 通常是 kw ，可以使用該方法定位搜索框。

from selenium import webdriver
from selenium.webdriver.common.by import By

driver = webdriver.Chrome()
driver.get('https://www.baidu.com')
search_box = driver.find_element(By.ID, 'kw')

在這里插入圖片描述

2. 通過 Name 定位

語法：運用 By.NAME 定位策略，代碼為 find_element(By.NAME, 'element_name')，element_name 是元素的 name 屬性值。
使用場景：常用于表單元素，在百度搜索場景中，如果搜索框有 name 屬性，就可以用這種方式定位。不過百度搜索框 name 也是 wd，與功能相關，方便表單提交數據。

driver.get('https://www.baidu.com')
search_box = driver.find_element(By.NAME, 'wd')

在這里插入圖片描述

3. 通過 Class Name 定位

語法：采用 By.CLASS_NAME 定位策略，代碼是 find_element(By.CLASS_NAME, 'element_class')，element_class 是元素的 class 屬性值。
使用場景：當需要定位一組具有相同樣式或功能的元素時使用。在百度搜索結果頁面，每個搜索結果的標題可能有相同的 class 名，可借此定位所有標題元素。

driver.get('https://www.baidu.com/s?wd=python')
result_titles = driver.find_elements(By.CLASS_NAME, 'cosc-title-slot') 
# 這里'cosc-title-slot' 需要替換為實際的 class 名

在這里插入圖片描述

4. 通過 Tag Name 定位

語法：使用 By.TAG_NAME 定位策略，代碼為 find_element(By.TAG_NAME, 'tag_name')，tag_name 是 HTML 標簽名，像 div、input、a 等。
使用場景：可快速定位某一類標簽元素，但通常會結合其他定位方法。例如在百度頁面獲取所有的鏈接元素（<a> 標簽）。

driver.get('https://www.baidu.com')
links = driver.find_elements(By.TAG_NAME, 'a')

5. 通過 Link Text 定位

語法：使用 By.LINK_TEXT 定位策略，代碼是 find_element(By.LINK_TEXT, 'link_text')，link_text 是 <a> 標簽的完整文本內容。
使用場景：專門用于定位鏈接元素，當知道鏈接的完整文本內容時使用。比如百度頁面上可能有“新聞”鏈接。

driver.get('https://www.baidu.com')
news_link = driver.find_element(By.LINK_TEXT, '新聞')

在這里插入圖片描述

6. 通過 Partial Link Text 定位

語法：使用 By.PARTIAL_LINK_TEXT 定位策略，代碼為 find_element(By.PARTIAL_LINK_TEXT, 'partial_link_text')，partial_link_text 是 <a> 標簽文本內容的一部分。
使用場景：當鏈接文本較長，只記得部分內容時適用。假設百度頁面有個鏈接文本是“百度學術 - 權威學術資源平臺”，只記得“百度學術”。

driver.get('https://www.baidu.com')
academic_link = driver.find_element(By.PARTIAL_LINK_TEXT, '百度學術')

7. 通過 CSS Selector 定位

語法：使用 By.CSS_SELECTOR 定位策略，代碼是 find_element(By.CSS_SELECTOR, 'css_selector')，css_selector 是符合 CSS 選擇器語法的表達式。
使用場景：CSS 選擇器很靈活，可結合元素的標簽名、類名、id、屬性等進行定位。比如定位百度搜索按鈕，它可能有特定的 class 和 type 屬性。

driver.get('https://www.baidu.com')
search_button = driver.find_element(By.CSS_SELECTOR, 'input.some-class[type="submit"]') 
# 這里'some-class' 需要替換為實際的 class 名

8. 通過 XPath 定位

語法：使用 By.XPATH 定位策略，代碼為 find_element(By.XPATH, 'xpath_expression')，xpath_expression 是符合 XPath 語法的表達式。
使用場景：XPath 是最強大的定位方式，能根據元素的屬性、層級關系、文本內容等進行定位，適用于復雜的定位需求。例如定位百度搜索結果中第一個標題元素。

driver.get('https://www.baidu.com/s?wd=python')
first_result_title = driver.find_element(By.XPATH, '//*[@id="1"]/div/div[1]/div[1]/h3/a[1]/em') 
# 這里的 XPath 要根據實際頁面結構調整

在這里插入圖片描述