python之图片识别文字


本人的tesseract本来是3.0.2的,可以正常识别英文,但是添加简体中文识别库以后,一运行就报错。

找了很多错误答案,正解就是这个了。

参考自本篇博客

果然是版本过低,没什么需要注意的。

只是设置环境变量:

TESSDATA_PREFIX
C:\Program Files (x86)\Tesseract-OCR\tessdata

这个变量要设置到识别库的目录才行,好多博客都是设置到安装目录就完事儿了,那样也是跑不起来了。

代码:

#!/usr/bin/python
# -*- coding:utf-8 -*-

import pytesseract
from PIL import Image
# 读取图片
im = Image.open('2.png')
# 识别文字
string = pytesseract.image_to_string(im,lang='chi_sim')
print(string)


免责声明!

本站转载的文章为个人学习借鉴使用,本站对版权不负任何法律责任。如果侵犯了您的隐私权益,请联系本站邮箱yoyou2525@163.com删除。



 
粤ICP备18138465号  © 2018-2025 CODEPRJ.COM