python 验证码识别示例(三) 简单验证码识别


今天介绍一个简单验证的识别。

主要是标准的格式,没有扭曲和变现。就用 pytesseract 去识别一下。

 

验证码地址:https://user.www.gov.cn/sso/verifyimg_edit?rd=0.22469390770687414

 

需要识别的验证码是:

 

 

识别结果是:

 




识别代码是:


#coding:utf-8
from common.contest import *
from PIL import Image
import pytesseract

def recognize_captcha(img_path):
    im = Image.open(img_path)
    tessdata_dir_config = '--tessdata-dir "C:\\Program Files (x86)\\Tesseract-OCR\\tessdata"'
    num = pytesseract.image_to_string(im,config=tessdata_dir_config)
    return num

if __name__ == '__main__':
    for i in range(1, 15):
        img_path = "3/" + str(i) + ".jpg"
        res = recognize_captcha(img_path)
        strs = res.split("\n")
        print strs[0]

 








 


免责声明!

本站转载的文章为个人学习借鉴使用,本站对版权不负任何法律责任。如果侵犯了您的隐私权益,请联系本站邮箱yoyou2525@163.com删除。



 
粤ICP备18138465号  © 2018-2025 CODEPRJ.COM