Python lxml解析HTML并用xpath獲取元素的方法
更新時間:2019年01月02日 10:12:27 作者:lilongsy
今天小編就為大家分享一篇Python lxml解析HTML并用xpath獲取元素的方法,具有很好的參考價值,希望對大家有所幫助。一起跟隨小編過來看看吧
代碼
使用方法見注釋
#-*- coding: UTF-8 -*- from lxml import etree source = u''' <div><p class="p1" data-a="1">測試數(shù)據(jù)1</p> <p class="p1" data-a="2">測試數(shù)據(jù)2</p> <p class="p1" data-a="3" style="height:100px;"> <strong class="s">測試數(shù)據(jù)3</strong></p> <p class="p1" data-a="4" width="200"><img src="1.jpg" class="img"/><br/> 圖片</p> ''' # 從字符串解析 page = etree.HTML(source) # 元素列表 ps = page.xpath("http://p") for p in ps: print u"屬性:%s" % p.attrib print u"文本:%s" % p.text # 文本列表 ts = page.xpath("http://p/text()") for t in ts: print t # xpath定位 ls = page.xpath('//p[@class="p1"][last()]/img') for l in ls: print l.attrib
以上這篇Python lxml解析HTML并用xpath獲取元素的方法就是小編分享給大家的全部內(nèi)容了,希望能給大家一個參考,也希望大家多多支持腳本之家。
相關(guān)文章
使用python實現(xiàn)多維數(shù)據(jù)降維操作
今天小編就為大家分享一篇使用python實現(xiàn)多維數(shù)據(jù)降維操作,具有很好的參考價值,希望對大家有所幫助。一起跟隨小編過來看看吧2020-02-02Python?+?Tkinter連接本地MySQL數(shù)據(jù)庫簡單實現(xiàn)注冊登錄
這篇文章主要介紹了Python?+?Tkinter連接本地MySQL數(shù)據(jù)庫簡單實現(xiàn)注冊登錄。下面文章著情介紹,需要的小伙伴可以參考一下2022-01-01python利用socket實現(xiàn)udp文件傳輸功能
這篇文章主要為大家詳細介紹了python利用socket實現(xiàn)udp文件傳輸功能,文中示例代碼介紹的非常詳細,具有一定的參考價值,感興趣的小伙伴們可以參考一下2021-09-09