pytesseract資源
鏈接:https://pan.baidu.com/s/1eTsqhsY 密碼:j0yo
安裝時前面一直next就可以了,直到這一步,勾選Math和Chinese,支持計算和中文
要記住安裝的目錄
我的是 F:\Program Files (x86)\Tesseract-OCR
然后,
在系統變量中添加一個TESSDATA_PREFIX,變量值還是文件路徑
我的是F:\Program Files (x86)\Tesseract-OCR
打開Python安裝路徑:\Python36\Lib\site-packages\pytesseract\pytesseract.py,把路徑改為自己的安裝路徑
運行下面代碼
from PIL import Image import pytesseract img = Image.open('aaa.png') text = pytesseract.image_to_string(img,lang='chi_sim') print (text)
圖片:1.png
運行結果
結果會有一點出入,需要對現有模型進行訓練才能提高匹配度
chi_sim.traineddata是中文對應的模型,后面會學習對模型的訓練,提供匹配度
關於安裝pytesseract的一些鏈接:
http://blog.csdn.net/cjvs9k/article/details/79044548
http://blog.csdn.net/qiushi_1990/article/details/78041375
http://blog.csdn.net/ztzy520/article/details/53946327
https://www.cnblogs.com/chenbjin/p/4147564.html