python讀取圖片里面的文字


需要安裝的依賴包:PIL  Pytesseract

1、安裝包

PIL 就是pillow包,直接找到對應的whl包安裝(https://www.lfd.uci.edu/~gohlke/pythonlibs/)

  注意:pillow是用於替代PIL的,所以在實際使用中需要import PIL而不是pillow

Pytesseract 直接pip安裝

  注意:Pytesseract安裝后不能直接使用,還需要安裝Tesseract-OCR

             安裝Tesseract-OCR后記錄安裝路徑:D:/Download/tesseract/tesseract.exe

                  在Pytesseract的源碼中修改

      源碼路徑:D:\Download\Anaconda\Lib\site-packages\pytesseract(我的Anaconda是安裝在D:\Download文件夾中)

      修改文件pytesseract.py(將下面一行的內容修改為上面一行):

        tesseract_cmd = r'D:/Download/tesseract/tesseract.exe'

        # tesseract_cmd = 'tesseract'

 

2、直接讀取圖片中的文字

from PIL import Image
import pytesseract

im = Image.open('001.png')
text = pytesseract.image_to_string(im)
print(text)

注意:如果圖片中有中文還需要下載中文庫放在Tesseract-OCR的安裝目錄的tessdata 文件夾下


免責聲明!

本站轉載的文章為個人學習借鑒使用,本站對版權不負任何法律責任。如果侵犯了您的隱私權益,請聯系本站郵箱yoyou2525@163.com刪除。



 
粵ICP備18138465號   © 2018-2025 CODEPRJ.COM