欧美bbbwbbbw肥妇,免费乱码人妻系列日韩,一级黄片

Python使用execjs執(zhí)行包含中文參數(shù)的JavaScript

 更新時(shí)間:2022年03月28日 16:15:54   作者:小小明-代碼實(shí)體  
爬蟲(chóng)的開(kāi)發(fā)過(guò)程中,往往需要對(duì)JS進(jìn)行模擬,簡(jiǎn)單或者通用的還可以在Python中模擬或者找到對(duì)應(yīng)的第三方庫(kù),但是復(fù)雜的就可能不好實(shí)現(xiàn)了,下面這篇文章主要給大家介紹了關(guān)于Python使用execjs執(zhí)行包含中文參數(shù)的JavaScript的相關(guān)資料,需要的朋友可以參考下

抓取到了一段包含數(shù)據(jù)的JavaScript代碼:

import re
import requests

headers = {
    "user-agent": "Mozilla/5.0 (Windows NT 10.0; WOW64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/86.0.4240.198 Safari/537.36",
    "accept": "text/html,application/xhtml+xml,application/xml;q=0.9,image/avif,image/webp,image/apng,*/*;q=0.8,application/signed-exchange;v=b3;q=0.9",
}
res = requests.get(
    "https://www.kuaikanmanhua.com/web/comic/100868/",
    headers=headers
)
script = re.findall(
    "<script>window.__NUXT__=([^<]+);</script>", res.text)[0].replace('\\u002F', "/")
script

結(jié)果:

image-20220223204934945

這段代碼直接在游覽器執(zhí)行可以得到對(duì)應(yīng)的JSON數(shù)據(jù),那么我們?nèi)绾问褂胮ython執(zhí)行這段代碼獲取JS數(shù)據(jù)呢?答案是使用execjs

安裝:

pip install PyExecJS 

但是如果此時(shí)在安裝過(guò)Nodejs的windows上直接執(zhí)行代碼:

import execjs

execjs.eval(script)

會(huì)報(bào)出如下錯(cuò)誤:

UnicodeDecodeError: 'gbk' codec can't decode byte 0xa4 in position 447: illegal multibyte sequence

此時(shí)我們需要重新指定execjs的環(huán)境為JScript:

import os

os.environ["EXECJS_RUNTIME"] = "JScript"

再次執(zhí)行可以順利得到結(jié)果。

如果我們確實(shí)需要使用本地nodejs的環(huán)境執(zhí)行JavaScript則需要修改修改execjs的源碼:

import os

os.environ["EXECJS_RUNTIME"] = "Node"
print(execjs.get().name)

Node.js (V8)

找到execjs安裝目錄下的_external_runtime.py文件:

image-20220223204010168

重啟程序再次執(zhí)行即可得到結(jié)果:

image-20220223204725760

execjs的調(diào)用函數(shù)或讀取變量示例:

import execjs

ctx = execjs.compile("""
       function add(x, y) {
               return x + y;
       }
       v = add(3, 4);
""")
print(ctx.call("add", 1, 2), ctx.eval("v"))

3 7

Lib\site-packages\execjs\runtime_names.py文件可以看到execjs所支持的JavaScript環(huán)境:

PyV8           = "PyV8"
Node           = "Node"
JavaScriptCore = "JavaScriptCore"
SpiderMonkey   = "SpiderMonkey"
JScript        = "JScript"
PhantomJS      = "PhantomJS"
SlimerJS       = "SlimerJS"
Nashorn        = "Nashorn"

總結(jié)

到此這篇關(guān)于Python使用execjs執(zhí)行包含中文參數(shù)JavaScript的文章就介紹到這了,更多相關(guān)execjs執(zhí)行包含中文參數(shù)js內(nèi)容請(qǐng)搜索腳本之家以前的文章或繼續(xù)瀏覽下面的相關(guān)文章希望大家以后多多支持腳本之家!

相關(guān)文章

最新評(píng)論