Python中Xpath Helper(xpath輔助插件)的具體使用
XPath Helper是一款免費的Chrome插件,專用于網(wǎng)頁解析和爬蟲輔助。它允許用戶輕松獲取網(wǎng)頁數(shù)據(jù)的XPath,以便進行批量爬取。下載插件后,通過拖拽安裝到Chrome瀏覽器,然后在網(wǎng)頁上右鍵檢查,復制XPath并輸入到XPath Helper查詢框,即可高亮顯示對應元素。此外,插件還支持批量獲取數(shù)據(jù)、鏈接和文本等功能,對于前端開發(fā)者和爬蟲工程師來說非常實用。
如下圖所示,在QUERY輸入框中寫XPath代碼,右側(cè)文本框會顯示查找到的xpath結(jié)果,在網(wǎng)頁中也會高亮度顯示xpath所在的位置。

一、下載XPath Helper
XPath Helper下載:XPath Helper_2.0.2_Chrome插件下載_極簡插件

1、進入并點擊 ‘推薦下載’ 即可下載出壓縮包,打開文件下載位置為一個zip文
2、將壓縮包解壓, 有兩個文件

二、加載XPath Helper插件至谷歌瀏覽器
1、使用谷歌瀏覽器,打開設置(Settings)

2、點擊擴展程序(Extensions)

3、打開 開發(fā)者模式(Developer mode)

4、將名為 ’hgimnogjllphhhkhlmebbmlgjoejdpjl_2.0.2_chrome.zzzmh.cn.crx‘ 的文件拖拽復制到chrome瀏覽器
5、點擊彈窗中 ‘Add extension’ (添加擴展) 按鈕;到此已將 Xpath Helper 插件已添加至谷歌瀏覽器
6、將 Xpath Helper 釘( pin ) 在主頁上, 便于后期插件的使用

三、Xpath Helper使用
這里以 www.baidu.com 頁面熱搜為例
1、右鍵熱搜鏈接,點擊檢查(inspect)

2、在彈出的 開發(fā)者工具欄 復制 Xpath (Copy Xpath) , 并點擊上方 xpath helper 插件

3、點擊插件后, 將剛復制的 xpath 粘貼至查詢框
? xpath正確,則結(jié)果框中顯示網(wǎng)頁中相應元素,且網(wǎng)頁中相應數(shù)據(jù)高亮顯示
//*[@id="hotsearch-content-wrapper"]/li[2]/a/span[2]

//*[@id="hotsearch-content-wrapper"]/li[2]/a/span[2]/text()

4、批量獲取數(shù)據(jù)
//*[@id="hotsearch-content-wrapper"]/li/a/span[2]

5、獲取鏈接
//*[@id="hotsearch-content-wrapper"]/li/a/@href

6、獲取文本
//*[@id="hotsearch-content-wrapper"]/li/a/span[2]/text()

到此這篇關于Python中Xpath Helper(xpath輔助插件)的具體使用的文章就介紹到這了,更多相關Python Xpath Helper內(nèi)容請搜索腳本之家以前的文章或繼續(xù)瀏覽下面的相關文章希望大家以后多多支持腳本之家!
相關文章
Python實現(xiàn)PDF文字識別提取并寫入CSV文件
這篇文章主要是和大家分享一個Python實現(xiàn)PDF文字識別與提取并寫入?CSV文件的腳本。文中的示例代碼講解詳細,感興趣的小伙伴可以了解一下2022-03-03
關于Flask項目無法使用公網(wǎng)IP訪問的解決方式
今天小編就為大家分享一篇關于Flask項目無法使用公網(wǎng)IP訪問的解決方式,具有很好的參考價值,希望對大家有所幫助。一起跟隨小編過來看看吧2019-11-11
Python實現(xiàn)一個帶權無回置隨機抽選函數(shù)的方法
這篇文章主要介紹了Python實現(xiàn)一個帶權無回置隨機抽選函數(shù)的方法,文中通過示例代碼介紹的非常詳細,對大家的學習或者工作具有一定的參考學習價值,需要的朋友們下面隨著小編來一起學習學習吧2019-07-07

