selenium+超級鷹實現(xiàn)模擬登錄12306
最近迷上了用selenium去登陸各大網(wǎng)站,別說selenium真挺好用,可以輕松搞定ajax動態(tài)加載的網(wǎng)頁,不用很費勁的去抓包查找??瓤取茴}了,回歸正題。
這次用selenium去登錄12306網(wǎng)站,聽說比較困難。我就去試了試,發(fā)現(xiàn)它的驗證碼實在是那啥…就是這樣的。聽頭疼的。
我來說說主要的代碼編寫吧。
過程:
用我們的開發(fā)者工具定位到輸入賬號和密碼的窗口,找到并send_keys
driver.find_element_by_id('username').send_keys('用戶名') time.sleep(0.5) driver.find_element_by_id('password').send_keys('密碼')
然后復(fù)雜的過程就來了。我們想要得到驗證碼的圖片。但是頭疼的是,圖片是再變化的。我們請求一次,就變化一次,不像其他普通網(wǎng)站一樣不會變化,直接保存圖片就行了。但是這是12306誒,哪這么輕松。想了想,我決定把整張頁面截屏保存下來,然后對驗證碼區(qū)域裁剪下來,就可以保證一致了。
# 將頁面進(jìn)行截圖并保存 driver.save_screenshot('12306登錄頁面截圖.png') # 確定驗證碼左上角和右下角的坐標(biāo) code_img = driver.find_element_by_xpath('//*[@id="loginForm"]/div/ul[2]/li[4]/div/div/div[3]/img') location = code_img.location # 確定驗證碼圖片左上角的坐標(biāo) print('location:', location) size = code_img.size # 確定驗證碼圖片的長和寬 print('size:', size) rangle = (int(location['x']), int(location['y']), int(location['x']) + int(size['width']), int(location['y']) + int(size['height'])) print('rangle:', rangle) i = Image.open('12306頁面截圖.png') # 對指定區(qū)域裁剪 code_pic = i.crop(rangle) file_name = 'code_pic.png' code_pic.save(file_name) time.sleep(2) print('驗證碼圖片保存成功??!')
我們識別驗證碼用的是超級鷹,具體如何使用可以去查一查。驗證碼有可能需要我們點擊多個,所以通過打碼平臺會得到多個坐標(biāo),就比如這種。有兩個日歷,需要點擊兩次,通過超級鷹就會得到兩個坐標(biāo)。如下圖。我們發(fā)現(xiàn)有兩個坐標(biāo)會有一個“|”,有三個坐標(biāo)就有兩個“|”,所以我們就把他們split下,讓每個坐標(biāo)嵌套再一個列表里。此過程代碼如下:
# 識別驗證坐標(biāo) chaojiying = Chaojiying_Client('用戶賬號', '密碼', '開發(fā)者賬號') # 用戶中心>>軟件ID 生成一個替換 96001 im = open('code_pic.png', 'rb').read() # 本地圖片文件路徑 來替換 a.jpg 有時WIN系統(tǒng)須要// result = chaojiying.PostPic(im, 9004)['pic_str'] # 1902 驗證碼類型 官方網(wǎng)站>>價格體系 3.4+版 print 后要加() all_list = [] # 存儲被點擊的坐標(biāo) if '|' in result: list1 = result.split('|') xy_list = [] count1 = len(list1) for i in list1: x = int(list1[i].split(',')[0]) xy_list.append(x) y = int(list1[i].split(',')[1]) xy_list.append(y) all_list.append(xy_list) else: xy_list = [] x = int(result.split(',')[0]) xy_list.append(x) y = int(result.split(',')[1]) xy_list.append(y) all_list.append(xy_list) print(all_list)
最后嘛,我們得到了驗證碼的坐標(biāo),當(dāng)然就去點擊啦。但是,這個坐標(biāo)是相對于驗證碼的圖片的坐標(biāo),我們必須用ActionChains來移動一下動作鏈的位置。把他移動到驗證碼圖片的location。,然后點擊就ok了。此步驟的代碼如下:
# 循環(huán)遍歷點擊圖片 for i in all_list: x = i[0] y = i[1] action = ActionChains(driver).move_to_element_with_offset(code_img, x, y).click().perform() time.sleep(1) driver.find_element_by_id('loginSub').click()
最后來看看全部代碼吧??!
這個代碼是超級鷹提供的接口。我封裝成一個類了。
#!/usr/bin/env python # coding:utf-8 import requests from hashlib import md5 class Chaojiying_Client(object): def __init__(self, username, password, soft_id): self.username = username password = password.encode('utf8') self.password = md5(password).hexdigest() self.soft_id = soft_id self.base_params = { 'user': self.username, 'pass2': self.password, 'softid': self.soft_id, } self.headers = { 'Connection': 'Keep-Alive', 'User-Agent': 'Mozilla/4.0 (compatible; MSIE 8.0; Windows NT 5.1; Trident/4.0)', } def PostPic(self, im, codetype): """ im: 圖片字節(jié) codetype: 題目類型 參考 http://www.chaojiying.com/price.html """ params = { 'codetype': codetype, } params.update(self.base_params) files = {'userfile': ('ccc.jpg', im)} r = requests.post('http://upload.chaojiying.net/Upload/Processing.php', data=params, files=files, headers=self.headers) return r.json() def ReportError(self, im_id): """ im_id:報錯題目的圖片ID """ params = { 'id': im_id, } params.update(self.base_params) r = requests.post('http://upload.chaojiying.net/Upload/ReportError.php', data=params, headers=self.headers) return r.json()
下面是自己寫的,也就六七十行。
from selenium import webdriver from chaojiying_Python.chaojiying import Chaojiying_Client import time from PIL import Image from selenium.webdriver import ActionChains from selenium.webdriver.chrome.options import Options # 實現(xiàn)無可視化界面的操作 # chrome_options = Options() # chrome_options.add_argument('--headless') # chrome_options.add_argument('--disable-gpu') driver = webdriver.Chrome('D:\software\studySoftware\chromedriver_win32\chromedriver.exe') driver.get('https://kyfw.12306.cn/otn/login/init') # driver.maximize_window() time.sleep(1) driver.find_element_by_id('username').send_keys('用戶名') time.sleep(0.5) driver.find_element_by_id('password').send_keys('密碼') # 將頁面進(jìn)行截圖并保存 driver.save_screenshot('12306登錄頁面截圖.png') # 確定驗證碼左上角和右下角的坐標(biāo) code_img = driver.find_element_by_xpath('//*[@id="loginForm"]/div/ul[2]/li[4]/div/div/div[3]/img') location = code_img.location # 確定驗證碼圖片左上角的坐標(biāo) print('location:', location) size = code_img.size # 確定驗證碼圖片的長和寬 print('size:', size) rangle = (int(location['x']), int(location['y']), int(location['x']) + int(size['width']), int(location['y']) + int(size['height'])) print('rangle:', rangle) i = Image.open('12306頁面截圖.png') # 對指定區(qū)域裁剪 code_pic = i.crop(rangle) file_name = 'code_pic.png' code_pic.save(file_name) time.sleep(2) print('驗證碼圖片保存成功!!') # 識別驗證坐標(biāo) chaojiying = Chaojiying_Client('用戶賬號', '密碼', '開發(fā)者賬號') # 用戶中心>>軟件ID 生成一個替換 96001 im = open('code_pic.png', 'rb').read() # 本地圖片文件路徑 來替換 a.jpg 有時WIN系統(tǒng)須要// result = chaojiying.PostPic(im, 9004)['pic_str'] # 1902 驗證碼類型 官方網(wǎng)站>>價格體系 3.4+版 print 后要加() all_list = [] # 存儲被點擊的坐標(biāo) if '|' in result: list1 = result.split('|') xy_list = [] count1 = len(list1) for i in list1: x = int(list1[i].split(',')[0]) xy_list.append(x) y = int(list1[i].split(',')[1]) xy_list.append(y) all_list.append(xy_list) else: xy_list = [] x = int(result.split(',')[0]) xy_list.append(x) y = int(result.split(',')[1]) xy_list.append(y) all_list.append(xy_list) print(all_list) # 循環(huán)遍歷點擊圖片 for i in all_list: x = i[0] y = i[1] action = ActionChains(driver).move_to_element_with_offset(code_img, x, y).click().perform() time.sleep(1) driver.find_element_by_id('loginSub').click()
到此這篇關(guān)于selenium+超級鷹實現(xiàn)模擬登錄12306的文章就介紹到這了,更多相關(guān)selenium 模擬登錄12306內(nèi)容請搜索腳本之家以前的文章或繼續(xù)瀏覽下面的相關(guān)文章希望大家以后多多支持腳本之家!
相關(guān)文章
python正則過濾字母、中文、數(shù)字及特殊字符方法詳解
這篇文章主要介紹了python正則過濾字母、數(shù)字及特殊字符方法詳解,需要的朋友可以參考下2020-02-02pyqt5 鍵盤監(jiān)聽按下enter 就登陸的實例
今天小編就為大家分享一篇pyqt5 鍵盤監(jiān)聽按下enter 就登陸的實例,具有很好的參考價值,希望對大家有所幫助。一起跟隨小編過來看看吧2019-06-06在Python的Flask中使用WTForms表單框架的基礎(chǔ)教程
WTForms由Python寫成,為表單而生,提供了很多制作Web表單的實用API,和Flask框架結(jié)合使用效果拔群,這里我們就一起看一下在Python的Flask中使用WTForms表單框架的基礎(chǔ)教程2016-06-06django manage.py擴(kuò)展自定義命令方法
今天小編就為大家分享一篇django manage.py擴(kuò)展自定義命令方法,具有很好的參考價值,希望對大家有所幫助。一起跟隨小編過來看看吧2018-05-05Python簡繁體轉(zhuǎn)換的簡單實現(xiàn)步驟
工作中需要將繁體中文轉(zhuǎn)換成簡體中文上網(wǎng)找了些資料,下面這篇文章主要給大家介紹了關(guān)于Python實現(xiàn)簡繁體轉(zhuǎn)換的相關(guān)資料,文中通過實例代碼介紹的非常詳細(xì),需要的朋友可以參考下2022-06-06