當我們分析爬蟲時,有時候會遇到一些加密參數,這個時候就需要我們逆向分析js
python執行js有一些第三方庫
https://www.jianshu.com/p/2da6f6ad01f0
因為我用的Python3,所以沒用PyV8(安裝網上的方法,也沒有安裝好,可能我太笨了 - -! 如果有會的麻煩指點一下)
我用的比較多的就是js2py和execjs
有一次在分析js時,我已經找到了對應的加密方法,在瀏覽器上運行時,直接拿到了結果,開心的一匹
然我把js代碼復制下來,在Python里通過js2py運行執行,發現報錯,說
ReferenceError: window is not defined
想到這個瀏覽器里的對象,感覺很絕望,然后想到execjs依賴node執行,是否可以從這里突破
結果依然不行,因為在node里也是只能運行js語法,window 和 document等對象是沒有的
后面機緣巧合之下,找到node里有一個庫jsdom,這個庫可以生成對應環境
https://www.npmjs.com/package/jsdom
全局安裝命令
npm i jsdom -g
可以看到導入后各種環境都有了,完美
所以我們只要在對應js代碼里最前面加上以下代碼就能正常運行
const jsdom = require("jsdom");
const { JSDOM } = jsdom;
const dom = new JSDOM(`<!DOCTYPE html><p>Hello world</p>`);
window = dom.window;
document = window.document;
XMLHttpRequest = window.XMLHttpRequest;
在全局安裝jsdom后,在node里按上面的寫法是沒有問題的,但是我們要在python中使用的話,不能在全局安裝
如果在全局安裝,使用時會報如下錯誤,說找不到jsdom
execjs._exceptions.ProgramError: Error: Cannot find module 'jsdom'
解決辦法有兩種
1.就是在python執行文件所在的運行目錄下,使用npm安裝jsdom
2. 使用cwd參數,指定模塊的所在目錄,比如,我們在全局安裝的jsdom,在cmd里通過npm root -g 可以查看全局模塊安裝路徑: C:\Users\w001\AppData\Roaming\npm\node_modules
我們使用時,代碼可以按下面的寫法寫
import execjs
with open(r'要運行的.js','r',encoding='utf-8') as f:
js = f.read()
ct = execjs.compile(js,cwd=r'C:\Users\w001\AppData\Roaming\npm\node_modules')
print(ct.call('Rohr_Opt.reload','1'))