欧美bbbwbbbw肥妇,免费乱码人妻系列日韩,一级黄片

selenium+chromedriver在服務(wù)器運(yùn)行的詳細(xì)教程

 更新時(shí)間:2020年03月31日 15:05:39   作者:woodcol  
這篇文章主要介紹了selenium+chromedriver在服務(wù)器運(yùn)行的詳細(xì)方法,本文給大家介紹的非常詳細(xì),對(duì)大家的學(xué)習(xí)或工作具有一定的參考借鑒價(jià)值,需要的朋友可以參考下

1.前言

想使用selenium從網(wǎng)站上抓數(shù)據(jù),但有時(shí)候使用phantomjs會(huì)出錯(cuò)。chrome現(xiàn)在也有無界面運(yùn)行模式了,以后就可以不用phantomjs了。

但在服務(wù)器安裝chrome時(shí)出現(xiàn)了一些錯(cuò)誤,這里總結(jié)一下整個(gè)安裝過程

2.ubuntu上安裝chrome

# Install Google Chrome
# https://askubuntu.com/questions/79280/how-to-install-chrome-browser-properly-via-command-line
sudo apt-get install libxss1 libappindicator1 libindicator7
wget https://dl.google.com/linux/direct/google-chrome-stable_current_amd64.deb
sudo dpkg -i google-chrome*.deb # Might show "errors", fixed by next line
sudo apt-get install -f

這時(shí)應(yīng)該已經(jīng)安裝好了,用下邊的命行運(yùn)行測(cè)試一下:

google-chrome --headless --remote-debugging-port=9222 https://chromium.org --disable-gpu

這里是使用headless模式進(jìn)行遠(yuǎn)程調(diào)試,ubuntu上大多沒有g(shù)pu,所以–disable-gpu以免報(bào)錯(cuò)。
之后可以再打開一個(gè)ssh連接到服務(wù)器,使用命令行訪問服務(wù)器的本地的9222端口:

curl http://localhost:9222

如果安裝好了,會(huì)看到調(diào)試信息。但我這里會(huì)報(bào)一個(gè)錯(cuò)誤,下邊是錯(cuò)誤的解決辦法。

1)可能的錯(cuò)誤解決方法

運(yùn)行完上邊的命令可能會(huì)報(bào)一個(gè)不能在root下運(yùn)行chrome的錯(cuò)誤。這個(gè)時(shí)候使用下邊方設(shè)置一下chrome

1.找到google-chrome文件

我的位置位于/opt/google/chrome/

2.用vi打開google-chrome文件

vi /opt/google/chrome/google-chrome

在文件中找到

exec -a "$0" "$HERE/chrome" "$@"

3.在后面添加 –user-data-dir –no-sandbox即可,整條shell命令就是

exec -a "$0" "$HERE/chrome" "$@" --user-data-dir --no-sandbox

4.再重新打開google-chrome即可正常訪問!

3.安裝chrome驅(qū)動(dòng)chromedriver

下載chromedriver

chromedriver提供了操作chrome的api,是selenium控制chrome的橋梁。

chromedriver最好安裝最新版的,記的我一開始安裝的不是最新版的,會(huì)報(bào)一個(gè)錯(cuò)。用最新版的chromedriver就沒有問題,最新版的可以在下邊地址找到
https://sites.google.com/a/chromium.org/chromedriver/downloads

我寫這個(gè)文章時(shí)最新版是2.37

wget https://chromedriver.storage.googleapis.com/2.37/chromedriver_linux64.zip
unzip chromedriver_linux64.zip

到這里服務(wù)器端的無界面版chrome就安裝好了。

4.無界面版chrome使用方法

from selenium import webdriver
chrome_options = webdriver.ChromeOptions()
chrome_options.add_argument('--headless')
chrome_options.add_argument('--disable-gpu')
chrome_options.add_argument("user-agent='Mozilla/5.0 (X11; Linux x86_64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/62.0.3202.94 Safari/537.36'")
wd = webdriver.Chrome(chrome_options=chrome_options,executable_path='/home/chrome/chromedriver')

wd.get("https://www.163.com")

content = wd.page_source.encode('utf-8')
print content

wd.quit()

這里chrome_options中的第三項(xiàng)設(shè)置參數(shù),使用這個(gè)設(shè)置可以避免網(wǎng)站檢測(cè)到你使用的是無界模式進(jìn)行反抓取。

下邊另外的兩項(xiàng)設(shè)置,不進(jìn)行設(shè)置時(shí)在桌面版linux系統(tǒng),或者mac系統(tǒng)上會(huì)打開有界面的chrome.調(diào)試時(shí)可以注釋掉下邊兩行使用有界面版chrome來調(diào)試程序。

chrome_options.add_argument('--headless')
chrome_options.add_argument('--disable-gpu')

5.參考

https://jiayi.space/post/zai-ubuntufu-wu-qi-shang-shi-yong-chrome-headless
https://blog.csdn.net/u013703963/article/details/71083802

總結(jié)

到此這篇關(guān)于selenium+chromedriver在服務(wù)器運(yùn)行的文章就介紹到這了,更多相關(guān)selenium+chromedriver在服務(wù)器運(yùn)行內(nèi)容請(qǐng)搜索腳本之家以前的文章或繼續(xù)瀏覽下面的相關(guān)文章希望大家以后多多支持腳本之家!

相關(guān)文章

  • 基于Tcl語言配置簡(jiǎn)單網(wǎng)絡(luò)環(huán)境過程解析

    基于Tcl語言配置簡(jiǎn)單網(wǎng)絡(luò)環(huán)境過程解析

    這篇文章主要介紹了基于Tcl語言配置簡(jiǎn)單網(wǎng)絡(luò)環(huán)境過程解析,文中通過示例代碼介紹的非常詳細(xì),對(duì)大家的學(xué)習(xí)或者工作具有一定的參考學(xué)習(xí)價(jià)值,需要的朋友可以參考下
    2020-07-07
  • 使用HMAILSERVER搭建郵件服務(wù)器圖文教程

    使用HMAILSERVER搭建郵件服務(wù)器圖文教程

    本文沒有什么高深的技術(shù)內(nèi)容,只是以windows server 2008 為例,使用HMAILServer,介紹搭建郵件服務(wù)器的全過程,供參考
    2016-10-10
  • 搭建dnsmasq自運(yùn)營(yíng)dns服務(wù)器的實(shí)現(xiàn)步驟

    搭建dnsmasq自運(yùn)營(yíng)dns服務(wù)器的實(shí)現(xiàn)步驟

    DNSmasq是一個(gè)輕巧的,容易使用的DNS服務(wù)工具,本文主要介紹了搭建dnsmasq自運(yùn)營(yíng)dns服務(wù)器的實(shí)現(xiàn)步驟,具有一定的參考價(jià)值,感興趣的可以了解一下
    2024-01-01
  • 寶塔面板定時(shí)訪問URL地址的實(shí)現(xiàn)步驟

    寶塔面板定時(shí)訪問URL地址的實(shí)現(xiàn)步驟

    寶塔面板挺好用的,特別是用來定時(shí)備份網(wǎng)站及數(shù)據(jù)庫、同步時(shí)間、釋放內(nèi)存等,本文主要介紹了寶塔面板定時(shí)訪問URL地址的實(shí)現(xiàn)步驟,具有一定的參考價(jià)值,感興趣的可以了解一下
    2023-08-08
  • 網(wǎng)站壓力測(cè)試工具-ab工具apache?bench使用過程

    網(wǎng)站壓力測(cè)試工具-ab工具apache?bench使用過程

    apache?bench是apache自帶的壓力測(cè)試工具。ab不僅可以對(duì)apache服務(wù)器進(jìn)行網(wǎng)站訪問壓力測(cè)試,也可以對(duì)或其它類型的服務(wù)器進(jìn)行壓力測(cè)試。ab工具上手學(xué)習(xí)較快,可以提供需要的基本性能指標(biāo),但沒有圖形化結(jié)果,不能監(jiān)控。因此可以用作臨時(shí)緊急任務(wù)和簡(jiǎn)單測(cè)試。
    2022-11-11
  • NAS(synology 群暉)首次使用教程

    NAS(synology 群暉)首次使用教程

    最近購買了群暉NAS企業(yè)2盤位網(wǎng)絡(luò)存儲(chǔ)云服務(wù)器DS716+,到手后發(fā)現(xiàn)教程也么有只有簡(jiǎn)單的硬盤安裝方法,經(jīng)過摸索終于知道大概怎么用的了,特分享一下方便需要的朋友
    2016-03-03
  • 磁盤陣列初步了解圖文教程

    磁盤陣列初步了解圖文教程

    閑來無事,組了個(gè)raid 0,感覺還不錯(cuò),速度有明顯提高,加載游戲和啟動(dòng)程序速度有所改善,一般服務(wù)器用的多
    2013-06-06
  • svn服務(wù)器安裝在centos7系統(tǒng)平臺(tái)

    svn服務(wù)器安裝在centos7系統(tǒng)平臺(tái)

    本文給大家介紹的是在centos7系統(tǒng)上安裝svn服務(wù)器的詳細(xì)教程,有需要的小伙伴可以參考下
    2018-04-04
  • 無需密碼通過ssh執(zhí)行rsync來同步文件的方法

    無需密碼通過ssh執(zhí)行rsync來同步文件的方法

    這篇文章主要介紹了無需密碼通過ssh執(zhí)行rsync來同步文件的方法,需要的朋友可以參考下
    2015-01-01
  • 阿里云快速搭建一個(gè)靜態(tài)網(wǎng)站的方法步驟

    阿里云快速搭建一個(gè)靜態(tài)網(wǎng)站的方法步驟

    這篇文章主要介紹了阿里云快速搭建一個(gè)靜態(tài)網(wǎng)站的方法步驟,小編覺得挺不錯(cuò)的,現(xiàn)在分享給大家,也給大家做個(gè)參考。一起跟隨小編過來看看吧
    2019-02-02

最新評(píng)論