一個(gè)依賴搞定?Spring?Boot?接口防盜刷的流程分析
kk-anti-reptile 是適用于基于 spring-boot 開發(fā)的分布式系統(tǒng)的反爬蟲組件。
系統(tǒng)要求?
- 基于 spring-boot 開發(fā)(spring-boot1.x, spring-boot2.x均可)
- 需要使用 redis
工作流程?
kk-anti-reptile 使用基于 Servlet 規(guī)范的的 Filter 對(duì)請(qǐng)求進(jìn)行過濾,在其內(nèi)部通過 spring-boot 的擴(kuò)展點(diǎn)機(jī)制,實(shí)例化一個(gè) Filter,并注入到 Spring 容器 FilterRegistrationBean 中,通過 Spring 注入到 Servlet 容器中,從而實(shí)現(xiàn)對(duì)請(qǐng)求的過濾。
在 kk-anti-reptile 的過濾 Filter 內(nèi)部,又通過責(zé)任鏈模式,將各種不同的過濾規(guī)則織入,并提供抽象接口,可由調(diào)用方進(jìn)行規(guī)則擴(kuò)展。
Filter 調(diào)用則鏈進(jìn)行請(qǐng)求過濾,如過濾不通過,則攔截請(qǐng)求,返回狀態(tài)碼 509,并輸出驗(yàn)證碼輸入頁(yè)面,輸出驗(yàn)證碼正確后,調(diào)用過濾規(guī)則鏈對(duì)規(guī)則進(jìn)行重置。
目前規(guī)則鏈中有如下兩個(gè)規(guī)則:
- ip-rule?:ip-rule 通過時(shí)間窗口統(tǒng)計(jì)當(dāng)前時(shí)間窗口內(nèi)請(qǐng)求數(shù),小于規(guī)定的最大請(qǐng)求數(shù)則可通過,否則不通過。時(shí)間窗口、最大請(qǐng)求數(shù)、ip 白名單等均可配置。
- ua-rule:ua-rule 通過判斷請(qǐng)求攜帶的 User-Agent,得到操作系統(tǒng)、設(shè)備信息、瀏覽器信息等,可配置各種維度對(duì)請(qǐng)求進(jìn)行過濾。
命中規(guī)則后
命中爬蟲和防盜刷規(guī)則后,會(huì)阻斷請(qǐng)求,并生成接除阻斷的驗(yàn)證碼,驗(yàn)證碼有多種組合方式,如果客戶端可以正確輸入驗(yàn)證碼,則可以繼續(xù)訪問:
驗(yàn)證碼有中文、英文字母+數(shù)字、簡(jiǎn)單算術(shù)三種形式,每種形式又有靜態(tài)圖片和 GIF 動(dòng)圖兩種圖片格式,即目前共有如下六種,所有類型的驗(yàn)證碼會(huì)隨機(jī)出現(xiàn),目前技術(shù)手段識(shí)別難度極高,可有效阻止防止爬蟲大規(guī)模爬取數(shù)據(jù):
接入使用
后端接入非常簡(jiǎn)單,只需要引用 kk-anti-reptile? 的 maven 依賴,并配置啟用 kk-anti-reptile 即可加入 maven 依賴:
<dependency> <groupId>cn.keking.project</groupId> <artifactId>kk-anti-reptile</artifactId> <version>1.0.0-SNAPSHOT</version> </dependency>
配置啟用 kk-anti-reptile:
anti.reptile.manager.enabled=true
前端需要在統(tǒng)一發(fā)送請(qǐng)求的 ajax 處加入攔截,攔截到請(qǐng)求返回狀態(tài)碼 509 后彈出一個(gè)新頁(yè)面,并把響應(yīng)內(nèi)容轉(zhuǎn)出到頁(yè)面中,然后向頁(yè)面中傳入后端接口 baseUrl 參數(shù)即可,以使用 axios 請(qǐng)求為例:
import axios from 'axios'; import {baseUrl} from './config'; axios.interceptors.response.use( data => { return data; }, error => { if (error.response.status === 509) { let html = error.response.data; let verifyWindow = window.open("","_blank","height=400,width=560"); verifyWindow.document.write(html); verifyWindow.document.getElementById("baseUrl").value = baseUrl; } } ); export default axios;
注意
(1) apollo-client 需啟用 bootstrap
使用 apollo 配置中心的用戶,由于組件內(nèi)部用到 @ConditionalOnProperty,要在 application.properties/bootstrap.properties 中加入如下樣例配置,(apollo-client 需要 0.10.0 及以上版本)詳見 apollo bootstrap 說明:
apollo.bootstrap.enabled = true
(2) 需要有 Redisson
連接如果項(xiàng)目中有用到 Redisson,kk-anti-reptile 會(huì)自動(dòng)獲取 RedissonClient 實(shí)例對(duì)象; 如果沒用到,需要在配置文件加入如下 Redisson 連接相關(guān)配置:
spring.redisson.address=redis://192.168.1.204:6379 spring.redisson.password=xxx
配置一覽表
在 spring-boot 中,所有配置在配置文件都會(huì)有自動(dòng)提示和說明,如下圖:
所有配置都以 anti.reptile.manager 為前綴,如下為所有配置項(xiàng)及說明:
到此這篇關(guān)于一個(gè)依賴搞定 Spring Boot 接口防盜刷的流程分析的文章就介紹到這了,更多相關(guān)Spring Boot 接口防盜刷內(nèi)容請(qǐng)搜索腳本之家以前的文章或繼續(xù)瀏覽下面的相關(guān)文章希望大家以后多多支持腳本之家!
相關(guān)文章
java多態(tài)性中的Overload和Override區(qū)別詳解
這篇文章主要介紹了java多態(tài)性中的Overload和Override區(qū)別詳解,重寫(Overriding)是父類與子類之間多態(tài)性的一種表現(xiàn),而重載(Overloading)是一個(gè)類中多態(tài)性的一種表現(xiàn),需要的朋友可以參考下2023-07-07IDEA+JRebel實(shí)現(xiàn)全自動(dòng)熱部署的方法步驟
這篇文章主要介紹了IDEA+JRebel實(shí)現(xiàn)全自動(dòng)熱部署的方法步驟,文中通過示例代碼介紹的非常詳細(xì),對(duì)大家的學(xué)習(xí)或者工作具有一定的參考學(xué)習(xí)價(jià)值,需要的朋友們下面隨著小編來(lái)一起學(xué)習(xí)學(xué)習(xí)吧2019-11-11mybatis的ParamNameResolver參數(shù)名稱解析
這篇文章主要為大家介紹了mybatis的ParamNameResolver參數(shù)名稱解析,有需要的朋友可以借鑒參考下,希望能夠有所幫助,祝大家多多進(jìn)步,早日升職加薪2023-08-08Java通過接口實(shí)現(xiàn)匿名類的實(shí)例代碼
這篇文章介紹了Java通過接口實(shí)現(xiàn)匿名類的實(shí)例代碼,有需要的朋友可以參考一下2013-10-10Java實(shí)現(xiàn)精準(zhǔn)Excel數(shù)據(jù)排序的方法詳解
在數(shù)據(jù)處理或者數(shù)據(jù)分析的場(chǎng)景中,需要對(duì)已有的數(shù)據(jù)進(jìn)行排序,在Excel中可以通過排序功能進(jìn)行整理數(shù)據(jù),而在Java中,則可以借助Excel表格插件對(duì)數(shù)據(jù)進(jìn)行批量排序,下面我們就來(lái)學(xué)習(xí)一下常見的數(shù)據(jù)排序方法吧2023-10-10SpringBoot 項(xiàng)目添加 MDC 日志鏈路追蹤的執(zhí)行流程
日志鏈路追蹤就是將一個(gè)標(biāo)志跨線程進(jìn)行傳遞,在一般的小項(xiàng)目中也就是在你新起一個(gè)線程的時(shí)候,或者使用線程池執(zhí)行任務(wù)的時(shí)候會(huì)用到,比如追蹤一個(gè)用戶請(qǐng)求的完整執(zhí)行流程,本文給大家介紹SpringBoot MDC 日志鏈路追蹤的代碼,感興趣的朋友一起看看吧2021-06-06