1,首先下載合適的tesseract-ocr的版本
2,然后安裝到這一步注意要勾選這一項來安裝OCR識別支持的語言包,這樣OCR就可以識別多國語言,然后就可以一直點擊下一步完成安裝。
3,安裝tesserocr庫,如果在pycharm里面的設置選項里直接安裝出錯,可以使用whl安裝,點擊這里下載合適版本的whl文件,放在python安裝目錄下的\Lib\site-packages文件夾里面,然后在這里打開cmd,輸入命令pip install (剛才下載的whl文件名,注意文件格式也要),就可以了。
4,運行測試代碼
import tesserocr from PIL import Image image = Image.open("test.jpg") text = tesserocr.image_to_text(image) print(text)
如果 這個測試代碼報錯 RuntimeError: Failed to init API, possibly an invalid tessdata path: C:\Users\Shawone\AppData\Local\Programs\Python\Python37\/tessdata/ ,只要把剛才安裝的tesseract下面的tessdata文件夾復制到python的安裝路徑里(與lib文件夾同級)
如果 結果為
C:\Users\Shawone\AppData\Local\Programs\Python\Python37\python.exe D:/project/capcha/01.py
Process finished with exit code 0
沒有報錯,但也沒有輸出任何信息,說明安裝成功,但是識別不了測試的圖片,可以前往中國知網注冊頁面下載驗證碼圖片進行測試。