版權聲明:本文為xing_star原創文章,轉載請注明出處!
本文同步自http://javaexception.com/archives/107
百度文字識別技術
近期有種場景,需要用到圖片識別技術,在網上找到了幾篇文章,tess_two Android圖片文字識別並且也提供了對應的demo演示,https://github.com/wangyisll/TessTwoDemo,經過運行觀察做實驗,發現效果不是很好,一個是耗時比較長,另一個是對中文不是特別友好,想了想,還是只能選擇國內廠商的方案,最終找到了百度雲文字識別 https://cloud.baidu.com/doc/OCR/index.html。這篇只是做簡單介紹,后續會結合一個真實的實用場景,運用上百度文字識別技術。
使用百度文字識別sdk
我選取的是Android版本的sdk,https://ai.baidu.com/sdk#ocr 到這個地址去下載適合自己語言的sdk。下載Android sdk后,https://ai.baidu.com/download?sdkId=55,壓縮包里包含了一個demo演示工程,用Android studio導入這個項目,同時配置好我們的License文件或者是appKey等密鑰,配置好鑒權所需要的信息,之后就運行demo,安裝到手機上,可以從手機中選擇一個有文本內容的圖片,開始測試效果。觀察到的效果還是可以的。速度跟准確率相對於tessTwo要高不少。
運行demo會碰到的問題或者是錯誤碼
http://ai.baidu.com/docs#/OCR-Android-SDK/1fe5dc4e 提供了各種錯誤碼提示,方便定位demo項目編譯中出現的問題
通用文字識別Api調用次數限制
企業不是做慈善的,百度雲通用文字識別Api,每日調用5w次免費,超過了就收費,個人小項目應該不會超過的,不過還是得注意下。
相關資料
TessTwoDemo https://github.com/wangyisll/TessTwoDemo