1. 環境:
系統環境:Win7 32 位系統
Python版本: 3.6.5 虛擬環境為:Miniconda3
2. 共需要安裝的模塊:
a. tesserocr
b. tesseract
c. PIL
3. 安裝方法:
我的安裝順序為:b -> a -> c
其實安裝最為麻煩,報錯最多的模塊是tesserocr,我嘗試了以下這些命令:
pip install tesserocr
pip3 install tesserocr
conda install tesserocr
conda install -c simonflueckiger tesserocr
前三個根本就是不行
最后一個確實是能找到tesserocr的資源,但是根本就下不動,我估計要是掛代理下載的話也許能行,有條件的可以試試。
最后我的解決辦是參照了這篇博客:win7系統安裝tesseract及tesserocr 中所講的方法,在網上下載了 tesserocr-2.4.0-cp36-cp36m-win32.whl 這個.whl文件來安裝,很好,安裝的很順利。其中需要注意的是,當你執行:pip install tesserocr-2.4.0-cp36-cp36m-win32.whl 這條命令的時候,如果你沒把你下載下來的.whl文件放在正確的文件目錄下的話,這條語句會報錯,提示你:tesserocr-2.4.0-cp36-cp36m-win32.whl似乎是一個文件名,但是在巴拉巴拉目錄下沒有該文件(當然人家是英文報錯,我給你翻譯了),那就好辦了,那就根據它的提示把該.whl文件放在它提示的文件目錄下就好了。
然后再說一下 關於 tesserocr 和 tesseract 版本匹配的問題,一開始我並不了解該怎么裝這些東西,所以在下載tesseract的時候(下載地址也參考我前文提到的博客)我就下載了最新的tesseract版本(tesseract-ocr-w32-setup-v5.0.0-alpha.20191030),心想肯定是最新的版本最厲害嘛,然后發現網上好多人說tesserocr的版本要和tesseract的版本匹配,如下圖:
但是我在安裝 tesseract-ocr-w32-setup-v5.0.0-alpha.20191030 時真的是用了很長時間,這個的安裝方法也參考我前文提到的博客。我是真的不想再去卸載掉然后下載個tesserocr v2.4.0版再浪費好幾個小時安裝一遍,所以我就抱着嘗試的心態,嘗試了一下,我發現
測試代碼:
1 import tesserocr 2 from PIL import Image 3 4 image = Image.open('image.png') 5 print(tesserocr.image_to_text(image))
運行結果:

沒想到它竟然能運行成功!!!
這兩個版本據說不符的家伙竟然被我給撮合到一起了???

那行吧,反正不報錯最好啦~
最后再說一下關於 安裝 pillow 遇到的報錯。
就是在Anaconda Promote中執行這條語句時:pip install pillow 報錯了:Could not find a version that satisfies the requirement PIL (from versions: ) No matching distribution found for PIL。
這個的解決方案參考這篇博客:【Python】Could not find a version that satisfies the requirement PIL (from versions: ) No matching distribution found for PIL 按照他的解決方案解決即可。
最后的最后,出了文中提到的幾篇博客之外,我覺得還有幾篇講得不錯的博客推薦給大家,安裝方法就不用過多關注了,按照我的方法來你們肯定能把環境搭起來了,這幾篇博客就供大家取材用吧。
2. tesserocr最新版本2.4.0安裝(windows)
