Python 通過打碼平台實現驗證碼


  在爬蟲時,經常遇到登錄需要驗證碼的情況,簡單的驗證碼可以自己解決,復制的驗證碼需要借助機器學習,有一定的難度。還有一個簡單的方案就是采用付費的打碼平台。

  比如R若快(http://www.ruokuai.com/client),還有雲打碼平台(http://www.yundama.com/price.html)

  下面以R若快為例介紹打碼平台的思路:

  R若快平台需要注冊兩個用戶,一個是普通用戶,一個開發者用戶,

  

  

  

   

 

 

 

 

  1、首先驗證碼截圖,就是截取網站上登錄頁面的驗證碼圖片並保存到本地

  2、調用打碼平台的接口把驗證碼圖片發送到打碼平台並獲取到驗證碼結果。

  具體代碼如下:

  

#!/usr/bin/env python
# coding:utf-8

import requests
from hashlib import md5


class RClient(object):

    def __init__(self, username='shaoks123', password='123456', soft_id='113452', soft_key='c0d07d796c8e470c92a126df60d61794'):
        self.username = username
        # self.password = md5(password).hexdigest()
        self.password = md5(password.encode("utf-8")).hexdigest()
        self.soft_id = soft_id
        self.soft_key = soft_key
        self.base_params = {
            'username': self.username,
            'password': self.password,
            'softid': self.soft_id,
            'softkey': self.soft_key,
        }
        self.headers = {
            'Connection': 'Keep-Alive',
            'Expect': '100-continue',
            'User-Agent': 'ben',
        }

    def rk_create(self, im, im_type, timeout=60):
        """
        im: 圖片字節
        im_type: 題目類型
        """
        params = {
            'typeid': im_type,
            'timeout': timeout,
        }
        params.update(self.base_params)
        files = {'image': ('a.jpg', im)}
        r = requests.post('http://api.ruokuai.com/create.json', data=params, files=files, headers=self.headers)
        return r.json()

    def rk_report_error(self, im_id):
        """
        im_id:報錯題目的ID
        """
        params = {
            'id': im_id,
        }
        params.update(self.base_params)
        r = requests.post('http://api.ruokuai.com/reporterror.json', data=params, headers=self.headers)
        return r.json()

    def test(self,imagefile,im_type=1030):
        # im = open('E:\python36_crawl\Veriycode\code\code_823.png', 'rb').read()
        im = open(imagefile, 'rb').read()
        result = self.rk_create(im, im_type)
        print(result['Result'])
        return result['Result']


# if __name__ == '__main__':
#     rc = RClient()
#     im = open('E:\python36_crawl\Veriycode\code\code_823.png', 'rb').read()
#     result = rc.rk_create(im, 1030)
#     print(result['Result'])

 


免責聲明!

本站轉載的文章為個人學習借鑒使用,本站對版權不負任何法律責任。如果侵犯了您的隱私權益,請聯系本站郵箱yoyou2525@163.com刪除。



 
粵ICP備18138465號   © 2018-2025 CODEPRJ.COM