遇到屏蔽selenium的站點如何突破


訪問某團外賣,查看下一頁商家信息,正常瀏覽器可以打開, selenium打開就404, 

分析請求參數,生成方法最后定位到 rohr*.js  而且有判斷selenium特征

抓耳撓腮搞了半天沒把這個js弄明白 ,只能用中間代理啦,

保存rohr*.js到本地把關鍵詞替換掉

上中間人代理 mitmproxy , 輸出替換成本地js

def response(flow:mitmproxy.http.HTTPFlow):
    try:
        url = flow.request.url
        if url == "http://s0.meituan.net/mx/rohr/rohr.min.js":
            global local_js
            if local_js is None:
                with open("rohr.local.js", "rb") as js:
                    local_js = js.read()
            flow.response.content = local_js
    except:
        return

我去去去

selenium在運行的時候會暴露的Javascript特征字符串:

window.navigator.webdriver
webdriver
__driver_evaluate
__webdriver_evaluate
__selenium_evaluate
__fxdriver_evaluate
__driver_unwrapped
__webdriver_unwrapped
__selenium_unwrapped
__fxdriver_unwrapped
_Selenium_IDE_Recorder
_selenium
calledSelenium
_WEBDRIVER_ELEM_CACHE
ChromeDriverw
driver-evaluate
webdriver-evaluate
selenium-evaluate
webdriverCommand
webdriver-evaluate-response
__webdriverFunc
__webdriver_script_fn
__$webdriverAsyncExecutor
__lastWatirAlert
__lastWatirConfirm
__lastWatirPrompt
$chrome_asyncScriptInfo
$cdc_asdjflasutopfhvcZLmcfl_


免責聲明!

本站轉載的文章為個人學習借鑒使用,本站對版權不負任何法律責任。如果侵犯了您的隱私權益,請聯系本站郵箱yoyou2525@163.com刪除。



 
粵ICP備18138465號   © 2018-2025 CODEPRJ.COM