OCR:光學識別符,tesserocr是python中一個OCR識別庫,是對tesseract做的一個python的 API封裝,所以它的核心是tesseract
在這里我安裝的版本是:tesseract-ocr-setup-3.05.02-20180621.exe

在這里勾選 ADditional language data(download)選項來安裝OCR識別的語言包,這樣可以識別多國語言,然后在一直點擊Next
安裝下來后配置環境變量
驗證安裝成功
安裝完成后將 C:\Program Files\Tesseract-OCR中的tessdata復制一份到python解釋器文件中,放入與Lib同級目錄中
下一步安裝
pip install tesserocr pillow
這里安裝會出現問題
我的解決辦法是:在這里下載對於的.whl文件
下載地址:https://github.com/simonflueckiger/tesserocr-windows_build/releases
我下載的版本為:tesserocr-2.2.2-cp36-cp36m-win_amd64.whl
將文件復制到c盤中進行安裝
安裝完成后驗證圖片
使用終端驗證
使用pycharm驗證
import tesserocr from PIL import Image image=Image.open('image.png') result=tesserocr.image_to_text(image) print(result)
在這里會報錯:
我的解決辦法是講python36整個文件夾復制到E盤中
得到結果: