python读取图片里面的文字


需要安装的依赖包:PIL  Pytesseract

1、安装包

PIL 就是pillow包,直接找到对应的whl包安装(https://www.lfd.uci.edu/~gohlke/pythonlibs/)

  注意:pillow是用于替代PIL的,所以在实际使用中需要import PIL而不是pillow

Pytesseract 直接pip安装

  注意:Pytesseract安装后不能直接使用,还需要安装Tesseract-OCR

             安装Tesseract-OCR后记录安装路径:D:/Download/tesseract/tesseract.exe

                  在Pytesseract的源码中修改

      源码路径:D:\Download\Anaconda\Lib\site-packages\pytesseract(我的Anaconda是安装在D:\Download文件夹中)

      修改文件pytesseract.py(将下面一行的内容修改为上面一行):

        tesseract_cmd = r'D:/Download/tesseract/tesseract.exe'

        # tesseract_cmd = 'tesseract'

 

2、直接读取图片中的文字

from PIL import Image
import pytesseract

im = Image.open('001.png')
text = pytesseract.image_to_string(im)
print(text)

注意:如果图片中有中文还需要下载中文库放在Tesseract-OCR的安装目录的tessdata 文件夹下


免责声明!

本站转载的文章为个人学习借鉴使用,本站对版权不负任何法律责任。如果侵犯了您的隐私权益,请联系本站邮箱yoyou2525@163.com删除。



 
粤ICP备18138465号  © 2018-2025 CODEPRJ.COM