要識別的圖片:

代碼:
from PIL import Image import pytesseract text=pytesseract.image_to_string(Image.open('denggao.jpeg'),lang='chi_sim') print(text)
效果截圖:

主要步驟:
1.需要兩個庫:pytesseract和PIL
(1)可以通過命令行安裝
pip install PIL
pip install pytesseract
(2)如果你用的pycharm編輯器,就可以直接借助pycharm實現快速安裝。
在pycharm的Settings設置頁按照下面步驟操作 :

可以通過同樣的步驟安裝PIL
2.安裝識別引擎tesseract-ocr
https://digi.bib.uni-mannheim.de/tesseract/tesseract-ocr-w64-setup-v5.0.0-alpha.20200223.exe
如有需求
附上各版本下載地址
https://github.com/UB-Mannheim/tesseract/wiki
3.識別中文,單獨安裝上識別引擎是無法識別中文的,需要另外下載一些東西
https://github.com/tesseract-ocr/tessdata
將里面的 chi_sim.traineddata、chi_sim_vert.traineddata、chi_tra.traineddata和chi_tra_vert.traineddata文件放入tesseract-ocr的tessdata目錄下

4.修改pytesseract.py
到你的Python的Lib\site-packages\pytesseract中找到pytesseract.py並修改其中的tesseract_cmd
修改為:
tesseract_cmd = 'D:/Tesseract-OCR/tesseract.exe'
之后就可以運行了。
配置過程中遇到的錯誤:
1.沒有安裝識別引擎會報這個錯誤:

2.識別引擎版本不對會報:
pytesseract.pytesseract.TesseractError: (1, "Error, unknown command line argument '-psm'")
