使用Python爬取彈出窗口信息的實(shí)例
此文僅當(dāng)學(xué)習(xí)筆記用.
這個(gè)實(shí)例是在Python環(huán)境下如何爬取彈出窗口的內(nèi)容,有些時(shí)候我們要在頁面中通過點(diǎn)擊,然后在彈出窗口中才有我們要的信息,所以平常用的方法也許不行.
這里我用到的是Selenium這個(gè)工具, 不知道的朋友可以去搜索一下. 但是安裝也是很費(fèi)事的. 而且我用的瀏覽器是firefox,不用IE是因?yàn)楹孟裥掳娴腎E在Selenium下有問題,我也是百思不得其解, 網(wǎng)上也暫時(shí)沒找到好的辦法.
from selenium import webdriver from selenium.webdriver.common.keys import Keys import os,time
browser=webdriver.Firefox(executable_path='d:\\Anaconda\\pkgs\\spyder-3.2.8-py36_0\\geckodriver.exe') #括號(hào)中的也是非典型的安裝firefox驅(qū)動(dòng)的方法,常規(guī)的方法我一直試的不行,但這種方法包管行. browser.get('http://XXX.XXX.com/fenxi/yazhi-734155') #輸入你的目標(biāo)網(wǎng)址 time.sleep(3) #打開網(wǎng)址后休息3秒鐘,可用可不用 browser.find_element_by_xpath('//*[@id="6"]/td[4]').click() #找到想要點(diǎn)擊的元素,然后進(jìn)行點(diǎn)擊動(dòng)作,讓窗口彈出來 handle=browser.current_window_handle #獲得當(dāng)前窗口,也就是彈出的窗口句柄,什么是句柄我也解釋不清楚,反正它代表當(dāng)前窗口 browser.switch_to_window(handle) #轉(zhuǎn)到當(dāng)前彈出窗口 s=browser.find_element_by_xpath('//*[@id="tipdiv"]/div[2]/table/tbody') #找到裝有你要信息的元素 print(s.text) #打印文本內(nèi)容 time.sleep(2) #休息2秒,讓瀏覽器喘口氣 browser.find_element_by_xpath('//*[@id="link106"]').click() #最后關(guān)掉彈出窗口. 這又是一個(gè)非典型方法,我是直接找到小窗口的叉叉來點(diǎn)擊關(guān)掉了,實(shí)際上Selinium有關(guān)閉當(dāng)前窗口的方法,也就是close()或者quit(),但問題是搞來搞去不行啊?我的理解是目前的窗口依然是那個(gè)彈出的窗口,但handle.close等其它方法都不行. 所以我干脆用這樣的方法,找到叉叉的元素,然后點(diǎn)擊.
最后找元素我還是喜歡用xpath,有個(gè)小竅門,那就是在瀏覽器的開發(fā)者工具那里面,找到需要元素的元代碼,然后右鍵選擇Copy Xpath就有了,相當(dāng)方便.
補(bǔ)充知識(shí):python自動(dòng)化測(cè)試中,點(diǎn)擊【查看】按鈕,彈窗出不來怎么辦?
一、在用python寫UI自動(dòng)化測(cè)試的時(shí)候,可能會(huì)遇到明明用.click()點(diǎn)擊了【查看】按鈕,但是彈窗彈不出來;
遇到這個(gè)問題的時(shí)候,不妨可以試試模擬鍵盤的操作,利用.send_keys(Keys.ENTER)便可以解決這個(gè)問題;
代碼:
driver.find_element_by_xpath(“//*[@id='main']/div/div[3]/div/div/div[2]/div/div[2]/div[2]/div/div[2]/table/tbody/tr/td[9]/div/button/span”).click()
修改為:
driver.find_element_by_xpath(“//*[@id='main']/div/div[3]/div/div/div[2]/div/div[2]/div[2]/div/div[2]/table/tbody/tr/td[9]/div/button/span”).send_keys(Keys.ENTER)
以上這篇使用Python爬取彈出窗口信息的實(shí)例就是小編分享給大家的全部?jī)?nèi)容了,希望能給大家一個(gè)參考,也希望大家多多支持腳本之家。
相關(guān)文章
Django+Uwsgi+Nginx如何實(shí)現(xiàn)生產(chǎn)環(huán)境部署
這篇文章主要介紹了Django+Uwsgi+Nginx如何實(shí)現(xiàn)生產(chǎn)環(huán)境部署,文中通過示例代碼介紹的非常詳細(xì),對(duì)大家的學(xué)習(xí)或者工作具有一定的參考學(xué)習(xí)價(jià)值,需要的朋友可以參考下2020-07-07Python實(shí)現(xiàn)對(duì)文件進(jìn)行單詞劃分并去重排序操作示例
這篇文章主要介紹了Python實(shí)現(xiàn)對(duì)文件進(jìn)行單詞劃分并去重排序操作,涉及Python文件讀取、字符串遍歷、拆分、排序等相關(guān)操作技巧,需要的朋友可以參考下2018-07-07python 執(zhí)行shell命令并將結(jié)果保存的實(shí)例
今天小編就為大家分享一篇python 執(zhí)行shell命令并將結(jié)果保存的實(shí)例,具有很好的參考價(jià)值,希望對(duì)大家有所幫助。一起跟隨小編過來看看吧2018-05-05Python應(yīng)用實(shí)現(xiàn)處理excel數(shù)據(jù)過程解析
這篇文章主要介紹了Python應(yīng)用實(shí)現(xiàn)處理excel數(shù)據(jù)過程解析,文中通過示例代碼介紹的非常詳細(xì),對(duì)大家的學(xué)習(xí)或者工作具有一定的參考學(xué)習(xí)價(jià)值,需要的朋友可以參考下2020-06-06Python?Pandas讀取Excel日期數(shù)據(jù)的異常處理方法
Excel文件是傳統(tǒng)的數(shù)據(jù)格式,但面對(duì)海量數(shù)據(jù)時(shí),用編程的方法來處理數(shù)據(jù)更有優(yōu)勢(shì),下面這篇文章主要給大家介紹了關(guān)于Python?Pandas讀取Excel日期數(shù)據(jù)的異常處理方法,需要的朋友可以參考下2022-02-02Python實(shí)現(xiàn)扣除個(gè)人稅后的工資計(jì)算器示例
這篇文章主要介紹了Python實(shí)現(xiàn)扣除個(gè)人稅后的工資計(jì)算器,涉及Python流程控制與數(shù)學(xué)運(yùn)算相關(guān)操作技巧,需要的朋友可以參考下2018-03-03Python實(shí)現(xiàn)矩陣運(yùn)算的方法代碼實(shí)例
這篇文章主要介紹了Python實(shí)現(xiàn)矩陣運(yùn)算的方法代碼實(shí)例,想用python實(shí)現(xiàn)一個(gè)矩陣類,它可以像matlab或者numpy中的矩陣一樣進(jìn)行運(yùn)算,生成一個(gè)矩陣類Matrix之后,他接收一個(gè)二維列表作為輸入,然后將對(duì)應(yīng)的值寫到矩陣對(duì)應(yīng)的位置,需要的朋友可以參考下2023-08-08