python ocr中文識別庫 tesseract安裝及問題處理

本文轉載自查看原文 2019-08-08 17:50 2714 python基礎/ python/ tesseract/ 中文識別庫/ ocr

這個破東西，折騰了快1個小時，網上的教材太亂了。

我解決的主要是windows的問題

先下載exe。（一看到這個，我就有種預感，不妙）

選好自己的機型，

最新版的，可能會采坑啊

安裝時可以添加支持的語言包，如下界面最后一個選項點開選擇，我們可以選擇簡體中文 Chiness(Simplified)。多選幾個吧

然后下一步。

完成后，添加環境變量

第一個環境變量

再配第二環境變量

我的機器運行提示要在這里找tessdata

Failed to init API, possibly an invalid tessdata path

就從安裝目錄下，直接把tessdata 文件夾里的內容都復制到

不要問為什么，這個缺德軟件就這樣

下一步安裝

pip install tesserocr pillow

如果提示c++什么的，不要安裝，使用

如果通過 pip 安裝失敗，可以嘗試 Anaconda 下的 conda 來安裝：

conda install -c simonflueckiger tesserocr pillow

親測有效。

還有一種辦法，我沒試過，應該也可以

我的解決辦法是：在這里下載對於的.whl文件

下載地址：https://github.com/simonflueckiger/tesserocr-windows_build/releases

我下載的版本為：tesserocr-2.2.2-cp36-cp36m-win_amd64.whl （注意版本號啊）

將文件復制到c盤中進行安裝

最后一步

pip install pytesseract

最后上代碼

import pytesseract

from PIL import Image

image = Image.open(r'd:\image.png')
result =pytesseract.image_to_string (image,lang='eng')
print(result)

　　親測有效啊！！

本站轉載的文章為個人學習借鑒使用，本站對版權不負任何法律責任。如果侵犯了您的隱私權益，請聯系本站郵箱yoyou2525@163.com刪除。

猜您在找 python安裝OCR識別庫基於tesseract-OCR進行中文識別 tesseract-ocr安裝問題開源OCR識別庫-Tesseract介紹 linux環境安裝tesseract OCR識別 python實現中文圖片文字識別--OCR about chinese text--tesseract Tesseract Ocr文字識別基於Tesseract組件的OCR識別 Python驗證碼識別安裝Pillow、tesseract-ocr與pytesseract模塊的安裝以及錯誤解決 tesseract-ocr 識別中文掃描圖片