教你如何用幾行Python代碼識別圖片文字--就是這么簡單!


今天給大家分享的主題是用百度的接口實現圖片的文字識別。

環境和配置要求

整體是用 Python 實現,所需要使用的第三方庫包括 aip 、 PIL 、 keyboard 、 pyinstaller ,如未安裝,可在CMD中使用pip install Baidu-AIP/pillow/keyboard/pyinstaller指令安裝。

百度接口

打開https://cloud.baidu.com/,

如未注冊請先注冊,然后登錄點擊管理控制台,點擊左側產品 服務 → 人工智能 → 文字識別 ,點擊創建應用,輸入應用名稱如 Baidu_OCR ,選擇用途如 學習辦公 ,最后進行簡單應用描述,即可點擊 立即創建 。

會出現應用列表,包括 AppID、API Key、Secret Key 等信息,這些稍后會用到。

打開步驟

具體實現步驟

整個程序的大致思路是,在用截圖軟件獲得截圖之后,交給百度接口識別,並返回結果,當然,也可以是本地圖片識別,我用的是QQ自帶截圖軟件,快捷鍵CTRL+ALT+A用來打開截圖,在選中所截區域后,按Enter鍵即可保存到粘貼板中,也可用其他截圖軟件。

①獲取截圖

keyboard類庫是用來監聽鍵盤動作的,所以在有快捷鍵按下之后,便會有相應動作。並用PIL中的 ImageGrab 來獲取到剪切板中的圖片並生成本地圖片文件。


②調用Baidu aip識別並打印文字

先用注冊時生成的應用的AppID、API Key、Secret Key初始化應用,再讀取保存到的圖片並打印識別的文字。


運行結果如圖所示:

運行截圖

我們還可增加一個無限循環使得一直能截圖。

③調用打包程序生成專屬識別文字小程序

用pyinstaller庫實現小程序的打包,生成.exe文件,這樣就能隨時識別文字了。在命令行中用pyinstaller xxx.py來打包生成exe文件,最后在生成的dist文件夾即可找到xxx.exe文件如下:

專屬文字識別小程序

附圖圖片識別案例

 

此文轉載文,著作權歸作者所有,如有侵權聯系小編刪除!

原文地址:https://www.tuicool.com/articles/36jErmJ

 

需要代碼的或者想了解更多的(點擊這里下載)


免責聲明!

本站轉載的文章為個人學習借鑒使用,本站對版權不負任何法律責任。如果侵犯了您的隱私權益,請聯系本站郵箱yoyou2525@163.com刪除。



 
粵ICP備18138465號   © 2018-2025 CODEPRJ.COM