使用八爪魚采集器采集滾動(dòng)加載和點(diǎn)擊加載數(shù)據(jù)的教程
現(xiàn)在很多網(wǎng)站的列表,需要向下滾動(dòng)頁面,才能加載出新數(shù)據(jù)。使用廣泛的火車頭采集器相對(duì)無力,使用八爪魚采集器可以采集滾動(dòng)刷新和點(diǎn)擊刷新。
適用場(chǎng)景:將滾動(dòng)條直接下來到網(wǎng)頁底部,出現(xiàn)類似【加載中】字樣,稍后馬上有新數(shù)據(jù)出現(xiàn),且滾動(dòng)條變短回彈。
我們需采集新聞列表數(shù)據(jù)。就需要在打開網(wǎng)頁后不斷向下滾動(dòng),加載新數(shù)據(jù)。
在八爪魚中怎么實(shí)現(xiàn)呢?以下為具體操作步驟。
步驟一、進(jìn)入自定義任務(wù)編輯頁面
把網(wǎng)址復(fù)制到八爪魚客戶端首頁的輸入框中,點(diǎn)擊開始采集進(jìn)入自定義任務(wù)配置頁面。
步驟二、設(shè)置滾動(dòng)方式,調(diào)整滾動(dòng)次數(shù)、每次間隔時(shí)間
點(diǎn)擊打開網(wǎng)頁步驟,在下方步驟設(shè)置區(qū)域點(diǎn)擊高級(jí)設(shè)置,找到頁面滾動(dòng),點(diǎn)擊勾選頁面滾動(dòng)。此網(wǎng)頁是無限滾動(dòng)的,八爪魚默認(rèn)設(shè)置的【滾動(dòng)方式】是滾動(dòng)到底部,默認(rèn)【滾動(dòng)次數(shù)】100次、默認(rèn)【每次間隔】1秒。大家可根據(jù)實(shí)際需求進(jìn)行調(diào)整?!久看伍g隔】時(shí)間需稍大于網(wǎng)頁上數(shù)據(jù)加載的時(shí)間(網(wǎng)頁上數(shù)據(jù)加載的時(shí)間又跟網(wǎng)速等因素有關(guān))。
結(jié)合這個(gè)網(wǎng)站的加載特征,這里修改【滾動(dòng)方式】為向下滾動(dòng)一屏(一般情況滾動(dòng)方式都建議大家選擇向下滾動(dòng)一屏);為方便演示,在這里,設(shè)置【滾動(dòng)次數(shù)】5次。
步驟三:配置列表數(shù)據(jù)采集。
啟動(dòng)采集來看一下采集結(jié)果。八爪魚自動(dòng)執(zhí)行了【直接滾動(dòng)到底部】5次,然后采集滾動(dòng)5次后的數(shù)據(jù)。
特別說明:
1、此網(wǎng)頁是無限向下滾動(dòng)加載數(shù)據(jù)的,八爪魚無法一次采集到所有數(shù)據(jù)。上面示例是設(shè)置了滾動(dòng)5次,實(shí)際采集過程中可根據(jù)需求來設(shè)置滾動(dòng)次數(shù)。
2、此類網(wǎng)頁常見于數(shù)據(jù)實(shí)時(shí)性高的新聞?lì)惥W(wǎng)站,在八爪魚中可以使用云采集,設(shè)置定時(shí)啟動(dòng),少量多次采集最新數(shù)據(jù)。
3、有時(shí)候網(wǎng)頁很快,類似【加載中】的提示不明顯?!臼欠裼行聰?shù)據(jù)出現(xiàn)】、【觀察滾動(dòng)條的回彈次數(shù)】是比較好用的判斷標(biāo)準(zhǔn),請(qǐng)注意觀察網(wǎng)頁。
4. 【向下滾動(dòng)一屏】的一屏,跟運(yùn)行采集任務(wù)時(shí)的窗口展示區(qū)域有關(guān)。如下圖,左側(cè)滾動(dòng)的一屏 > 右側(cè)滾動(dòng)的一屏。
5.若設(shè)置滾動(dòng)后啟動(dòng)采集不滾動(dòng)的,可能是頁面是局部滾動(dòng)的,需要設(shè)置局部滾動(dòng)不是全局滾動(dòng)。局部滾動(dòng)判斷方式,在目標(biāo)網(wǎng)頁打開【調(diào)試控制臺(tái)】輸入:document.scrollingElement.scrollBy(0, 100) 回車運(yùn)行。如果頁面沒有向下滾動(dòng),說明不是全局滾動(dòng)。
到此這篇關(guān)于使用八爪魚采集器采集滾動(dòng)刷新和點(diǎn)擊刷新的教程的文章就介紹到這了,更多相關(guān)八爪魚采集器采集滾動(dòng)刷新和點(diǎn)擊刷新內(nèi)容請(qǐng)搜索腳本之家以前的文章或繼續(xù)瀏覽下面的相關(guān)文章希望大家以后多多支持腳本之家!
相關(guān)文章
C++/QT/Python/MATLAB獲取文件行數(shù)的示例詳解
這篇文章主要為大家學(xué)習(xí)介紹了如何利用C++、QT、Python、MATLAB分別實(shí)現(xiàn)獲取文件行數(shù)的功能,文中的示例代碼講解詳細(xì),需要的可以參考一下2023-08-08Git Submodule管理項(xiàng)目子模塊的使用
這篇文章主要介紹了Git Submodule管理項(xiàng)目子模塊的使用,文中通過示例代碼介紹的非常詳細(xì),對(duì)大家的學(xué)習(xí)或者工作具有一定的參考學(xué)習(xí)價(jià)值,需要的朋友們下面隨著小編來一起學(xué)習(xí)學(xué)習(xí)吧2020-08-08Chrome拓展(Chrome Extension)開發(fā)定時(shí)任務(wù)插件
文章講述了如何在ChromeExtension中實(shí)現(xiàn)定時(shí)任務(wù),包括使用chrome.alarmsAPI、結(jié)合contentscript的狀態(tài)感知定時(shí)器和基于事件觸發(fā)的模擬定時(shí),文章強(qiáng)調(diào)了任務(wù)的冪等性、狀態(tài)的持久化存儲(chǔ)、記錄執(zhí)行日志和防止重復(fù)執(zhí)行的重要性2025-04-04使用roolup構(gòu)建你的lib(實(shí)現(xiàn)步驟)
大家都知道Rollup更加適合用于構(gòu)建lib 而 Webpack, Precel 更加適合開發(fā)應(yīng)用。本文,將結(jié)合一個(gè)簡(jiǎn)單的例子說說如何使用Rollup構(gòu)建自己的lib,感興趣的朋友一起看看吧2021-08-08MacOS上Homebrew?安裝、配置、更改國(guó)內(nèi)鏡像源及使用圖文詳解
Homebrew是一個(gè)強(qiáng)大的包管理器,適用于macOS和Linux系統(tǒng),可以簡(jiǎn)化軟件的安裝、升級(jí)和卸載過程,它包括brew、homebrew-core、homebrew-cask和homebrew-bottles四個(gè)主要部分,通過tap和cask可以擴(kuò)展功能,安裝圖形界面應(yīng)用,Homebrew還提供了各種命令來管理和維護(hù)已安裝的軟件包2024-11-11