PyExecJS 安裝
pip install PyExecJS
PyExecJS 的基本使用:
>>> import execjs >>> execjs.eval("'red yellow blue'.split(' ')") ['red', 'yellow', 'blue'] >>> ctx = execjs.compile(""" ... function add(x, y) { ... return x + y; ... } ... """) >>> ctx.call("add", 1, 2) 3
這里使用了一個網站的網頁做示例,它的源代碼中有這么一段
我們的目標是提取圖中的json數據,代碼如下:
Python import requests import re import execjs from lxml import etree from pprint import pprint url = 'https://www.madewell.com/cn/madewell_category/SHIRTSTOPS/topsblouses/PRDOVR~F9375/F9375.jsp' res = requests.get(url) doc = etree.HTML(res.text) data = ''.join(doc.xpath('//script[contains(text(),"var data")]/text()')) json_raw = re.search('({[\S\s]*\})',data).group(1) jsn = execjs.eval(json_raw) pprint(jsn)
執行結果如下圖:
那么 怎么執行一個.js后綴的文件呢
import execjs with open("baidujs.js") as f: jsData = f.read() # e是 baidujs.js 的一個js 函數 p = execjs.compile(jsData).call("e",inputData)
p 獲取的就是函數執行的返回值