python 文字識別 之 pytesseract


 

pytesseract資源

鏈接:https://pan.baidu.com/s/1eTsqhsY 密碼:j0yo

 安裝時前面一直next就可以了,直到這一步,勾選Math和Chinese,支持計算和中文

要記住安裝的目錄

我的是 F:\Program Files (x86)\Tesseract-OCR

 然后,

在系統變量中添加一個TESSDATA_PREFIX,變量值還是文件路徑
我的是F:\Program Files (x86)\Tesseract-OCR

 

打開Python安裝路徑:\Python36\Lib\site-packages\pytesseract\pytesseract.py,把路徑改為自己的安裝路徑

 

 運行下面代碼

from PIL import Image
import pytesseract

img = Image.open('aaa.png')
text = pytesseract.image_to_string(img,lang='chi_sim')
print (text)

  

 圖片:1.png

運行結果

 

結果會有一點出入,需要對現有模型進行訓練才能提高匹配度

chi_sim.traineddata是中文對應的模型,后面會學習對模型的訓練,提供匹配度

 

關於安裝pytesseract的一些鏈接:

http://blog.csdn.net/cjvs9k/article/details/79044548

http://blog.csdn.net/qiushi_1990/article/details/78041375

http://blog.csdn.net/ztzy520/article/details/53946327

https://www.cnblogs.com/chenbjin/p/4147564.html


免責聲明!

本站轉載的文章為個人學習借鑒使用,本站對版權不負任何法律責任。如果侵犯了您的隱私權益,請聯系本站郵箱yoyou2525@163.com刪除。



 
粵ICP備18138465號   © 2018-2025 CODEPRJ.COM