python實戰===用python識別圖片中的中文


需要安裝的模塊

PIL

pytesseract

需要下載的工具:

http://download.csdn.net/download/bo_mask/10196285

因為之前百度雲的鏈接總失效,所以上傳到了csdn,如果csdn沒有積分的朋友可以到qq群中下載

下載解壓后,安裝到默認的路徑下,安裝完成后如下圖1:

 

 

並且復制解壓文件的chi_sim.traineddata 文件到安裝路徑 C:\Program Files (x86)\Tesseract-OCR\tessdata  下圖2,圖3:

好的,如果你上面所有安裝完了,那么還有最后一步,更改配置文件,位置如下圖4:

打開后將原來的注釋掉,新增:

# CHANGE THIS IF TESSERACT IS NOT IN YOUR PATH, OR IS NAMED DIFFERENTLY
# tesseract_cmd = 'tesseract'

tesseract_cmd = u'C:/Program Files (x86)/Tesseract-OCR/tesseract.exe'        #此路徑是你安裝后的路徑,對應的是圖1的路徑

 保存!環境配置結束~



 

 

如下圖,保存為111.png:

 

#test.py

from
PIL import Image import pytesseract text=pytesseract.image_to_string(Image.open('111.png'),lang='chi_sim') print(text)

執行結果:

 

(─.─|||   。。。 。。。。

順便提一下

如果有任何問題,你可以在這里找到我 ,軟件測試交流qq群,209092584


免責聲明!

本站轉載的文章為個人學習借鑒使用,本站對版權不負任何法律責任。如果侵犯了您的隱私權益,請聯系本站郵箱yoyou2525@163.com刪除。



 
粵ICP備18138465號   © 2018-2025 CODEPRJ.COM