Python中執(zhí)行調(diào)用JS的多種實(shí)現(xiàn)方法總結(jié)
1. 寫在前面
做爬蟲的人大家都知道,現(xiàn)在國內(nèi)Web或App普遍防護(hù)都做的很好,且越有價(jià)值的網(wǎng)站這方面越強(qiáng)
再小再弱的網(wǎng)站現(xiàn)在或多或少都要整點(diǎn)反爬
JS在反爬中應(yīng)用非常廣泛,現(xiàn)在做爬蟲工程師基本都要懂JS,因?yàn)楦鞣NJS加密需要逆向!破解JS加密只是第一步,之后就是如何在我們的Python代碼中直接執(zhí)行JS,下面介紹一下幾種Python中執(zhí)行JS代碼的方法
2. PyExecJS方法
首先第一步安裝:
pip3 install PyExecJS
PyExecJS 是一個(gè)簡單易用的庫,它提供了一個(gè)通用的接口來執(zhí)行 JavaScript代碼,可以在多個(gè)JavaScript 運(yùn)行時(shí)環(huán)境下工作,包括 Node.js、PhantomJS
然后導(dǎo)入excejs,它是一個(gè)在 Python中執(zhí)行JS代碼的庫,使用示例如下:
md5_js =
'''function hex_md5(s){ return binl2hex(core_md5(str2binl(s), s.length * 8));}
function b64_md5(s){ return binl2b64(core_md5(str2binl(s), s.length * 8));}
function hex_hmac_md5(key, data) { return binl2hex(core_hmac_md5(key, data)); }
function b64_hmac_md5(key, data) { return binl2b64(core_hmac_md5(key, data)); }
function calcMD5(s){ return binl2hex(core_md5(str2binl(s), s.length * 8));}
function md5_vm_test()
{
return hex_md5("abc") == "900150983cd24fb0d6963f7d28e17f72";
}
function cxx(a, d) {
var e;
a = a - 0,e = str_spl[a]
return e;
}
function core_md5(x, len)
{
x[len >> 5] |= 0x80 << ((len) % 32);
x[(((len + 64) >>> 9) << 4) + 14] = len;
var a = 1732584193;
var b = -271733879;
var c = -1732584194;
var d = 271733878;
for(var i = 0; i < x.length; i += 16)
{
var olda = a;
var oldb = b;
var oldc = c;
var oldd = d;
a = md5_ff(a, b, c, d, x[i+ 0], 7 , -680876936);
d = md5_ff(d, a, b, c, x[i+ 1], 12, -389564586);
c = md5_ff(c, d, a, b, x[i+ 2], 17, 606105819);
b = md5_ff(b, c, d, a, x[i+ 3], 22, -1044525330);
a = md5_ff(a, b, c, d, x[i+ 4], 7 , -176418897);
d = md5_ff(d, a, b, c, x[i+ 5], 12, 1200080426);
c = md5_ff(c, d, a, b, x[i+ 6], 17, -1473231341);
b = md5_ff(b, c, d, a, x[i+ 7], 22, -45705983);
a = md5_ff(a, b, c, d, x[i+ 8], 7 , 1770035416);
d = md5_ff(d, a, b, c, x[i+ 9], 12, -1958414417);
c = md5_ff(c, d, a, b, x[i+10], 17, -42063);
b = md5_ff(b, c, d, a, x[i+11], 22, -1990404162);
a = md5_ff(a, b, c, d, x[i+12], 7 , 1804603682);
d = md5_ff(d, a, b, c, x[i+13], 12, -40341101);
c = md5_ff(c, d, a, b, x[i+14], 17, -1502002290);
b = md5_ff(b, c, d, a, x[i+15], 22, 1236535329);
a = md5_gg(a, b, c, d, x[i+ 1], 5 , -165796510);
d = md5_gg(d, a, b, c, x[i+ 6], 9 , -1069501632);
c = md5_gg(c, d, a, b, x[i+11], 14, 643717713);
b = md5_gg(b, c, d, a, x[i+ 0], 20, -373897302);
a = md5_gg(a, b, c, d, x[i+ 5], 5 , -701558691);
d = md5_gg(d, a, b, c, x[i+10], 9 , 38016083);
c = md5_gg(c, d, a, b, x[i+15], 14, -660478335);
b = md5_gg(b, c, d, a, x[i+ 4], 20, -405537848);
a = md5_gg(a, b, c, d, x[i+ 9], 5 , 568446438);
d = md5_gg(d, a, b, c, x[i+14], 9 , -1019803690);
c = md5_gg(c, d, a, b, x[i+ 3], 14, -187363961);
b = md5_gg(b, c, d, a, x[i+ 8], 20, 1163531501);
a = md5_gg(a, b, c, d, x[i+13], 5 , -1444681467);
d = md5_gg(d, a, b, c, x[i+ 2], 9 , -51403784);
c = md5_gg(c, d, a, b, x[i+ 7], 14, 1735328473);
b = md5_gg(b, c, d, a, x[i+12], 20, -1926607734);
a = md5_hh(a, b, c, d, x[i+ 5], 4 , -378558);
d = md5_hh(d, a, b, c, x[i+ 8], 11, -2022574463);
c = md5_hh(c, d, a, b, x[i+11], 16, 1839030562);
b = md5_hh(b, c, d, a, x[i+14], 23, -35309556);
a = md5_hh(a, b, c, d, x[i+ 1], 4 , -1530992060);
d = md5_hh(d, a, b, c, x[i+ 4], 11, 1272893353);
c = md5_hh(c, d, a, b, x[i+ 7], 16, -155497632);
b = md5_hh(b, c, d, a, x[i+10], 23, -1094730640);
a = md5_hh(a, b, c, d, x[i+13], 4 , 681279174);
d = md5_hh(d, a, b, c, x[i+ 0], 11, -358537222);
c = md5_hh(c, d, a, b, x[i+ 3], 16, -722521979);
b = md5_hh(b, c, d, a, x[i+ 6], 23, 76029189);
a = md5_hh(a, b, c, d, x[i+ 9], 4 , -640364487);
d = md5_hh(d, a, b, c, x[i+12], 11, -421815835);
c = md5_hh(c, d, a, b, x[i+15], 16, 530742520);
b = md5_hh(b, c, d, a, x[i+ 2], 23, -995338651);
a = md5_ii(a, b, c, d, x[i+ 0], 6 , -198630844);
d = md5_ii(d, a, b, c, x[i+ 7], 10, 1126891415);
c = md5_ii(c, d, a, b, x[i+14], 15, -1416354905);
b = md5_ii(b, c, d, a, x[i+ 5], 21, -57434055);
a = md5_ii(a, b, c, d, x[i+12], 6 , 1700485571);
d = md5_ii(d, a, b, c, x[i+ 3], 10, -1894986606);
c = md5_ii(c, d, a, b, x[i+10], 15, -1051523);
b = md5_ii(b, c, d, a, x[i+ 1], 21, -2054922799);
a = md5_ii(a, b, c, d, x[i+ 8], 6 , 1873313359);
d = md5_ii(d, a, b, c, x[i+15], 10, -30611744);
c = md5_ii(c, d, a, b, x[i+ 6], 15, -1560198380);
b = md5_ii(b, c, d, a, x[i+13], 21, 1309151649);
a = md5_ii(a, b, c, d, x[i+ 4], 6 , -145523070);
d = md5_ii(d, a, b, c, x[i+11], 10, -1120210379);
c = md5_ii(c, d, a, b, x[i+ 2], 15, 718787259);
b = md5_ii(b, c, d, a, x[i+ 9], 21, -343485551);
a = safe_add(a, olda);
b = safe_add(b, oldb);
c = safe_add(c, oldc);
d = safe_add(d, oldd);
}
return Array(a, b, c, d);
}
function md5_cmn(q, a, b, x, s, t)
{
return safe_add(bit_rol(safe_add(safe_add(a, q), safe_add(x, t)), s),b);
}
function md5_ff(a, b, c, d, x, s, t)
{
return md5_cmn((b & c) | ((~b) & d), a, b, x, s, t);
}
function md5_gg(a, b, c, d, x, s, t)
{
return md5_cmn((b & d) | (c & (~d)), a, b, x, s, t);
}
function md5_hh(a, b, c, d, x, s, t)
{
return md5_cmn(b ^ c ^ d, a, b, x, s, t);
}
function md5_ii(a, b, c, d, x, s, t)
{
return md5_cmn(c ^ (b | (~d)), a, b, x, s, t);
}
function core_hmac_md5(key, data)
{
var bkey = str2binl(key);
if(bkey.length > 16) bkey = core_md5(bkey, key.length * 8);
var ipad = Array(16), opad = Array(16);
for(var i = 0; i < 16; i++)
{
ipad[i] = bkey[i] ^ 0x36363636;
opad[i] = bkey[i] ^ 0x5C5C5C5C;
}
var hash = core_md5(ipad.concat(str2binl(data)), 512 + data.length * 8);
return core_md5(opad.concat(hash), 512 + 128);
}
function safe_add(x, y)
{
var lsw = (x & 0xFFFF) + (y & 0xFFFF);
var msw = (x >> 16) + (y >> 16) + (lsw >> 16);
return (msw << 16) | (lsw & 0xFFFF);
}
function bit_rol(num, cnt)
{
return (num << cnt) | (num >>> (32 - cnt));
}
function str2binl(str)
{
var bin = Array();
var mask = (1 << 8) - 1;
for(var i = 0; i < str.length * 8; i += 8)
bin[i>>5] |= (str.charCodeAt(i / 8) & mask) << (i%32);
return bin;
}
function binl2hex(binarray)
{
var hex_tab = 0 ? "0123456789ABCDEF" : "0123456789abcdef";
var str = "";
for(var i = 0; i < binarray.length * 4; i++)
{
str += hex_tab.charAt((binarray[i>>2] >> ((i%4)*8+4)) & 0xF) +
hex_tab.charAt((binarray[i>>2] >> ((i%4)*8 )) & 0xF);
}
return str;
}
function binl2b64(binarray)
{
var tab = "ABCDEFGHIJKLMNOPQRSTUVWXYZabcdefghijklmnopqrstuvwxyz0123456789+/";
var str = "";
for(var i = 0; i < binarray.length * 4; i += 3)
{
var triplet = (((binarray[i >> 2] >> 8 * ( i %4)) & 0xFF) << 16)
| (((binarray[i+1 >> 2] >> 8 * ((i+1)%4)) & 0xFF) << 8 )
| ((binarray[i+2 >> 2] >> 8 * ((i+2)%4)) & 0xFF);
for(var j = 0; j < 4; j++)
{
if(i * 8 + j * 6 > binarray.length * 32) str += '';
else str += tab.charAt((triplet >> 6*(3-j)) & 0x3F);
}
}
return str;
}'''
content = '加密內(nèi)容'
ctx = execjs.compile(md5_js)
sk = ctx.call('hex_md5', content)call里面的參數(shù)第一個(gè)是JS函數(shù)名稱, 如果要執(zhí)行的JS有參數(shù), 后面跟上參數(shù)就可以像上面content即可
3. js2py方法
首先第一步安裝:
pip3 install js2py
js2py是一個(gè)專門為 Python 設(shè)計(jì)的庫,允許在 Python 中執(zhí)行 JavaScript代碼,并且提供了較完整的 JavaScript 解釋器。它支持更復(fù)雜的JavaScript 特性,如閉包和異常處理
適用于一些逆向工程場景,因?yàn)樗軌蛱幚硪恍┗煜蛷?fù)雜的 JavaScript 代碼
它的原理將JS代碼直接轉(zhuǎn)譯成Python代碼執(zhí)行,不用安裝運(yùn)行本地環(huán)境,啟動比較快
不過轉(zhuǎn)譯時(shí)增加了執(zhí)行時(shí)間,而且轉(zhuǎn)譯時(shí)有時(shí)會報(bào)錯(cuò),特別是JS代碼很多時(shí),由于不使用本地JS環(huán)境,所以像JS混淆的代碼轉(zhuǎn)譯時(shí)往往容易報(bào)錯(cuò)
使用示例:
import js2py
js2py.eval_js('console.log( "Hello World!" )')使用execute執(zhí)行JS代碼示例:
import js2py
context = js2py.EvalJs() # 實(shí)例化解析js對象
js_code = '''
var a = 10
function f(x) {return x*x}
'''
context.execute(js_code) # 調(diào)用js代碼里面的函數(shù)
context.a在JS中直接使用Python內(nèi)置函數(shù)示例:
import js2py
context = js2py.EvalJs({'python_sum': sum})
context.eval('python_sum(new Array(1, 2, 3))')函數(shù)sum是Python里面的函數(shù),可以直接在js2py中使用,其實(shí)很好理解,因?yàn)閖s2py是把js轉(zhuǎn)譯成python代碼再來執(zhí)行,當(dāng)然可以直接執(zhí)行Python函數(shù)了
轉(zhuǎn)譯JS文件方式示例:
from example import example
js2py.translate_file('example.js', 'example.py')
example.someFunction()除了使用之前上面的方法外,還可以把JS文件轉(zhuǎn)譯成Python代碼后再調(diào)用,這樣做的好處是不用每次調(diào)用JS文件都要轉(zhuǎn)譯一次
現(xiàn)在js2py還支持JavaScript6 ,更多使用技巧感興趣的大家可以去官網(wǎng)查看:Js2Py
4. node方法
首先確定先安裝好nodejs,然后使用subprocess調(diào)用node子進(jìn)程來執(zhí)行JS
優(yōu)點(diǎn):速度快,而且一般不會出錯(cuò),因?yàn)閚odejs跟chrome瀏覽器一樣使用的是v8引擎,在這五種方法中此方法最可靠,特別是有大量js代碼要執(zhí)行時(shí),建議直接調(diào)用node
缺點(diǎn):需要安裝nodejs,并且如果大廠網(wǎng)站或app的js一般都會檢測nodejs,所以js代碼必須處理好,否則無法通過
import subprocess
# js文件最后必須有輸出,我使用的是 console.log
pro = subprocess.run("node abc.js", stdout=subprocess.PIPE)
# 獲得標(biāo)準(zhǔn)輸出
_token = pro.stdout
# 轉(zhuǎn)一下格式
token = _token.decode().strip()5. Selenium方法
首先第一步安裝:
pip3 install selenium
Selenium是一個(gè)自動化測試工具,可以模擬瀏覽器行為??梢栽跒g覽器中執(zhí)行JavaScript,用于實(shí)現(xiàn)網(wǎng)頁渲染一系列操作
這里我們需要先下載webdriver以及安裝chrome瀏覽器,或其它瀏覽器及其相應(yīng)webdriver
driver地址:chromedriver
Selenium官方網(wǎng)站:Selenium
優(yōu)點(diǎn):省去了摳JS代碼那些枯燥與繁瑣的事項(xiàng)
缺點(diǎn):必須有瀏覽器環(huán)境支持,執(zhí)行效率低,只適合在有瀏覽器環(huán)境的情況下執(zhí)行JS代碼
一般不推薦使用selenium,但是如果不介意采集效率低的話,selenium算一個(gè)不錯(cuò)的選擇
使用示例:
from selenium import webdriver
jsstr = '''
function add() {
let a = 1;
let b = 2;
return a+b;
}'''
# 調(diào)用js
driver = webdriver.chrome()
# 異步用這個(gè)driver.execute_async_script(js)
result = driver.execute_script(jsstr)
print(result)下面是早些年的一段更新瀏覽器User-Agent的JS調(diào)用:

6. PyV8方法
PyV8是一個(gè)基于Google V8引擎的庫,提供在Python中執(zhí)行 JavaScript代碼的功能。它在性能上具有優(yōu)勢,因?yàn)閂8引擎是高性能的JavaScript引擎
PyV8只支持Python2的pip安裝,不支持python3環(huán)境下的pip安裝,請直接到官網(wǎng)下載安裝二進(jìn)制文件:PyV8
然后解壓后將PyV8.py 與 _PyV8.so (注意:如不是這兩個(gè)文件名需要修改),將兩文件復(fù)制到Python的site-packages目錄下,如/usr/local/lib/python3.6/site-packages
使用示例:
import PyV8
ctxt = PyV8.JSContext()
# ctxt.__enter__()
ctxt.enter()
jsstr = '''
function add() {
let a = 1;
let b = 2;
return a+b;
}'''
result = ctxt.eval(jsstr)
print(result)最后大家可以根據(jù)自己的業(yè)務(wù)需求去選擇以上適合的方法。
總結(jié)
到此這篇關(guān)于Python中執(zhí)行調(diào)用JS的多種實(shí)現(xiàn)方法總結(jié)的文章就介紹到這了,更多相關(guān)Python執(zhí)行調(diào)用JS內(nèi)容請搜索腳本之家以前的文章或繼續(xù)瀏覽下面的相關(guān)文章希望大家以后多多支持腳本之家!
相關(guān)文章
Python?from?import導(dǎo)包ModuleNotFoundError?No?module?named
最近在執(zhí)行python腳本時(shí),from?import的模塊沒有被加載進(jìn)來,找不到module,這篇文章主要給大家介紹了關(guān)于Python?from?import導(dǎo)包ModuleNotFoundError?No?module?named找不到模塊問題的解決辦法,需要的朋友可以參考下2022-08-08
python繪圖subplots函數(shù)使用模板的示例代碼
這篇文章主要介紹了python繪圖subplots函數(shù)使用模板的示例代碼,本文給大家介紹的非常詳細(xì),對大家的學(xué)習(xí)或工作具有一定的參考借鑒價(jià)值,需要的朋友可以參考下2021-04-04
Python實(shí)現(xiàn)CART決策樹算法及詳細(xì)注釋
CART算法是一種樹構(gòu)建算法,既可以用于分類任務(wù),又可以用于回歸,本文僅討論基本的CART分類決策樹構(gòu)建,不討論回歸樹和剪枝等問題,感興趣的朋友跟隨小編一起看看吧2021-10-10
Python使用sys.path查看當(dāng)前的模塊搜索路徑
sys.path 是 Python 中的一個(gè)列表,它用于存儲模塊搜索路徑,當(dāng)你使用 import 語句導(dǎo)入一個(gè)模塊時(shí),Python 會按照 sys.path 列表中的路徑順序來查找這個(gè)模塊,本文給大家介紹了Python使用sys.path查看當(dāng)前的模塊搜索路徑,需要的朋友可以參考下2025-02-02
Python+matplotlib實(shí)現(xiàn)量場圖的繪制
matplotlib是基于Python語言的開源項(xiàng)目,pyplot提供一系列繪制2D圖形的方法。本文將帶大家學(xué)習(xí)matplotlib.pyplot.quiver()相關(guān)方法屬性并通過其繪制量場圖2021-12-12

