python之图像识别


1. 安装配置

1、pip install pytesseract

2、pip install pillow

3、安装tesseract-ocr:http://jaist.dl.sourceforge.net/project/tesseract-ocr-alt/tesseract-ocr-setup-3.02.02.exe

4、找到 pytesseract.py 更改 tesseract_cmd = r'C:\Program Files (x86)\Tesseract-OCR\tesseract.exe'

5、添加环境变量(变量名:TESSDATA_PREFIX,变量值:C:\Program Files (x86)\Tesseract-OCR,即安装目录)

6、如果识别中文,下载 chi_sim.traineddata,并拷贝到 C:\Program Files (x86)\Tesseract-OCR\tessdata目录下

 

2.识别中文

2.1图片

2.2 运行程序

#!/usr/bin/env python
# -*- codinfg:utf-8 -*-
'''
@author: Jeff LEE
@file: 图片识别.py
@time: 2018-07-20 10:59
@desc:
'''
from PIL import Image
import pytesseract

Image = Image.open('e.jpg')   # 打开图片
text = pytesseract.image_to_string(Image,lang='chi_sim')  #使用简体中文解析图片
print(text)

2.3 运行结果

 


免责声明!

本站转载的文章为个人学习借鉴使用,本站对版权不负任何法律责任。如果侵犯了您的隐私权益,请联系本站邮箱yoyou2525@163.com删除。



 
粤ICP备18138465号  © 2018-2025 CODEPRJ.COM