今天安裝tesseract-ocr的時候,載了坑,記錄一下。
1. 安裝時語言庫的選擇,我把 aditional language data 這一項全選中了,裝的時候那叫一個慢啊,差不多3個小時裝好的。如果不是必要的話,建議選擇其中的一部分去安裝。
2. 安裝好了,在命令行里直接輸入 “tesseract“ 也是沒有問題,但是在實際使用的過程中,總是報錯。如下
Traceback (most recent call last): File "C:/Users/Administrator/******.py", line 6, in <module> print(tesserocr.image_to_text(image)) File "tesserocr.pyx", line 2400, in tesserocr._tesserocr.image_to_text RuntimeError: Failed to init API, possibly an invalid tessdata path: C:\ProgramData\Anaconda3\
最簡單的解決方法,一個是檢查環境變量的問題。
另一個就是,將C:\Program Files (x86)\Tesseract-OCR目錄(tesseract-ocr默認安裝目錄)下的tessdata文件夾拷貝到C:\ProgramData\Anaconda3目錄,就是報錯信息的最后,那個目錄。
有問題可以留言,可能解決方法並不適用各種情況,大家一起研究。