python使用execjs執行含有document、window等對象的js代碼,使用jsdom解決


當我們分析爬蟲時,有時候會遇到一些加密參數,這個時候就需要我們逆向分析js

python執行js有一些第三方庫

https://www.jianshu.com/p/2da6f6ad01f0

因為我用的Python3,所以沒用PyV8(安裝網上的方法,也沒有安裝好,可能我太笨了 - -! 如果有會的麻煩指點一下)

我用的比較多的就是js2py和execjs

有一次在分析js時,我已經找到了對應的加密方法,在瀏覽器上運行時,直接拿到了結果,開心的一匹

然我把js代碼復制下來,在Python里通過js2py運行執行,發現報錯,說

ReferenceError: window is not defined

想到這個瀏覽器里的對象,感覺很絕望,然后想到execjs依賴node執行,是否可以從這里突破

結果依然不行,因為在node里也是只能運行js語法,window 和 document等對象是沒有的

后面機緣巧合之下,找到node里有一個庫jsdom,這個庫可以生成對應環境

https://www.npmjs.com/package/jsdom

全局安裝命令

npm i jsdom -g


可以看到導入后各種環境都有了,完美

所以我們只要在對應js代碼里最前面加上以下代碼就能正常運行

const jsdom = require("jsdom");
const { JSDOM } = jsdom;
const dom = new JSDOM(`<!DOCTYPE html><p>Hello world</p>`);
window = dom.window;
document = window.document;
XMLHttpRequest = window.XMLHttpRequest;

在全局安裝jsdom后,在node里按上面的寫法是沒有問題的,但是我們要在python中使用的話,不能在全局安裝
如果在全局安裝,使用時會報如下錯誤,說找不到jsdom

execjs._exceptions.ProgramError: Error: Cannot find module 'jsdom'

解決辦法有兩種
1.就是在python執行文件所在的運行目錄下,使用npm安裝jsdom
2. 使用cwd參數,指定模塊的所在目錄,比如,我們在全局安裝的jsdom,在cmd里通過npm root -g 可以查看全局模塊安裝路徑: C:\Users\w001\AppData\Roaming\npm\node_modules
我們使用時,代碼可以按下面的寫法寫

import execjs
with open(r'要運行的.js','r',encoding='utf-8') as f:
    js = f.read()
ct = execjs.compile(js,cwd=r'C:\Users\w001\AppData\Roaming\npm\node_modules')
print(ct.call('Rohr_Opt.reload','1'))


免責聲明!

本站轉載的文章為個人學習借鑒使用,本站對版權不負任何法律責任。如果侵犯了您的隱私權益,請聯系本站郵箱yoyou2525@163.com刪除。



 
粵ICP備18138465號   © 2018-2025 CODEPRJ.COM