記錄安裝Python第三方包“tesserocr”的方法和遇到的坑


1. 環境:

系統環境:Win7 32 位系統

Python版本: 3.6.5        虛擬環境為:Miniconda3

2. 共需要安裝的模塊:

a. tesserocr 

b. tesseract

c. PIL

3. 安裝方法:

我的安裝順序為:b -> a -> c

其實安裝最為麻煩,報錯最多的模塊是tesserocr,我嘗試了以下這些命令:

pip install tesserocr

pip3 install tesserocr

conda install tesserocr

conda install -c simonflueckiger tesserocr

前三個根本就是不行

最后一個確實是能找到tesserocr的資源,但是根本就下不動,我估計要是掛代理下載的話也許能行,有條件的可以試試。

最后我的解決辦是參照了這篇博客win7系統安裝tesseract及tesserocr 中所講的方法,在網上下載了 tesserocr-2.4.0-cp36-cp36m-win32.whl 這個.whl文件來安裝,很好,安裝的很順利。其中需要注意的是當你執行pip install tesserocr-2.4.0-cp36-cp36m-win32.whl 這條命令的時候,如果你沒把你下載下來的.whl文件放在正確的文件目錄下的話,這條語句會報錯,提示你:tesserocr-2.4.0-cp36-cp36m-win32.whl似乎是一個文件名,但是在巴拉巴拉目錄下沒有該文件(當然人家是英文報錯,我給你翻譯了),那就好辦了,那就根據它的提示把該.whl文件放在它提示的文件目錄下就好了。

然后再說一下 關於 tesserocr 和 tesseract 版本匹配的問題一開始我並不了解該怎么裝這些東西,所以在下載tesseract的時候(下載地址也參考我前文提到的博客)我就下載了最新的tesseract版本(tesseract-ocr-w32-setup-v5.0.0-alpha.20191030),心想肯定是最新的版本最厲害嘛,然后發現網上好多人說tesserocr的版本要和tesseract的版本匹配,如下圖:

 

但是我在安裝 tesseract-ocr-w32-setup-v5.0.0-alpha.20191030 時真的是用了很長時間,這個的安裝方法也參考我前文提到的博客。我是真的不想再去卸載掉然后下載個tesserocr v2.4.0版再浪費好幾個小時安裝一遍,所以我就抱着嘗試的心態,嘗試了一下,我發現

測試代碼:

1 import tesserocr
2 from PIL import Image
3 
4 image = Image.open('image.png')
5 print(tesserocr.image_to_text(image))

運行結果:

 

沒想到它竟然能運行成功!!!

這兩個版本據說不符的家伙竟然被我給撮合到一起了???

 

那行吧,反正不報錯最好啦~

最后再說一下關於 安裝 pillow 遇到的報錯

就是在Anaconda Promote中執行這條語句時:pip install pillow 報錯了:Could not find a version that satisfies the requirement PIL (from versions: ) No matching distribution found for PIL。

這個的解決方案參考這篇博客:【Python】Could not find a version that satisfies the requirement PIL (from versions: ) No matching distribution found for PIL 按照他的解決方案解決即可。

 

最后的最后,出了文中提到的幾篇博客之外,我覺得還有幾篇講得不錯的博客推薦給大家,安裝方法就不用過多關注了,按照我的方法來你們肯定能把環境搭起來了,這幾篇博客就供大家取材用吧。

1. Python tesserocr模塊使用示例

2. tesserocr最新版本2.4.0安裝(windows)

3. 爬蟲如何解決圖片驗證碼問題

 


免責聲明!

本站轉載的文章為個人學習借鑒使用,本站對版權不負任何法律責任。如果侵犯了您的隱私權益,請聯系本站郵箱yoyou2525@163.com刪除。



 
粵ICP備18138465號   © 2018-2025 CODEPRJ.COM