極驗滑塊驗證的使用

本文轉載自查看原文 2018-05-15 20:01 1142

# 爬取河南企業信用信息公示系統為案例
# 案例網址 http://gsxt.haaic.gov.cn/index.jspx

下面這個選項一定要勾選

極驗打碼要的參數

要爬取數據所在的頁面

根據上面的截圖然后找到相對應的菜蔬然后下面這個代碼就可以實現打印list頁面的源代碼，剩下的就是用解析器解析的部分。

import requests
import json
from urllib.parse import quote
class Qy():
    def __init__(self):
        self.headers = {'User-Agent': 'Mozilla/5.0 (Windows NT 10.0; WOW64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/66.0.3359.139 Safari/537.36'}
        self.req = requests.session()


    def get_html(self,url):
        try:
            response = self.req.get(url,headers=self.headers)
            if response.status_code == 200:
                return response.text
            return None
        except:
            print('獲取challenge和ht信息失敗')

    def parse_html(self,html):
        html_dic = json.loads(html)
        url = "http://jiyanapi.c2567.com/shibie?user=username&pass=123456&return=json&ip=&gt=" + html_dic['gt'] + "&challenge=" + html_dic['challenge']
        return self.get_html(url)

    def get_page_html(self,html_json):
        url = 'http://gsxt.haaic.gov.cn/validateSecond.jspx'
        html_dic = json.loads(html_json)
        data = {
            'searchText': '中國',
            'geetest_challenge': html_dic['challenge'],
            'geetest_validate': html_dic['validate'],
            'geetest_seccode': html_dic['validate']+'|jordan',
        }
        html = self.req.post(url,headers=self.headers,data=data).text
        html_di = json.loads(html)
        name = quote(quote('中國'))
        url1 = 'http://gsxt.haaic.gov.cn/'+html_di['obj']+'&searchType=1&entName='+name
        return self.req.get(url,headers=self.headers).text



def main():
    qy = Qy()
    # 獲取challenge和ht信息
    html = qy.get_html('http://gsxt.haaic.gov.cn/registerValidate.jspx')
    # 使用打碼平台進行打碼
    html_json = qy.parse_html(html)
    # 獲取網頁的數據
    data = qy.get_page_html(html_json)
    # 打印網頁的數據
    print(data)


if __name__ == '__main__':
    main()

免責聲明！

本站轉載的文章為個人學習借鑒使用，本站對版權不負任何法律責任。如果侵犯了您的隱私權益，請聯系本站郵箱yoyou2525@163.com刪除。

猜您在找 破解滑塊（極驗）驗證碼思路 python爬蟲--------處理極驗驗證（滑塊拼圖驗證）bilibili模式 python3 破解 geetest（極驗）的滑塊驗證碼 python3 破解 geetest（極驗）的滑塊驗證碼 selenium+java破解極驗滑塊驗證碼對極驗geetest滑塊驗證碼圖片還原算法的研究 php+js實現極驗，拖動滑塊驗證碼驗證表單 php+js實現極驗滑塊拖動驗證碼-tncode 阿里、騰訊、網易、極驗、頂象滑塊驗證碼識別極驗滑塊js逆向破解