需要安裝的依賴包:PIL Pytesseract
1、安裝包
PIL 就是pillow包,直接找到對應的whl包安裝(https://www.lfd.uci.edu/~gohlke/pythonlibs/)
注意:pillow是用於替代PIL的,所以在實際使用中需要import PIL而不是pillow
Pytesseract 直接pip安裝
注意:Pytesseract安裝后不能直接使用,還需要安裝Tesseract-OCR
安裝Tesseract-OCR后記錄安裝路徑:D:/Download/tesseract/tesseract.exe
在Pytesseract的源碼中修改
源碼路徑:D:\Download\Anaconda\Lib\site-packages\pytesseract(我的Anaconda是安裝在D:\Download文件夾中)
修改文件pytesseract.py(將下面一行的內容修改為上面一行):
tesseract_cmd = r'D:/Download/tesseract/tesseract.exe'
# tesseract_cmd = 'tesseract'
2、直接讀取圖片中的文字
from PIL import Image import pytesseract im = Image.open('001.png') text = pytesseract.image_to_string(im) print(text)
注意:如果圖片中有中文還需要下載中文庫放在Tesseract-OCR的安裝目錄的tessdata 文件夾下