javacv文字識別系列:
javaCV文字識別之1:基於google的tesserac ocr識別圖片中的文字,跨平台支持英文中文簡體繁體等各種字符識別
前言
上一章我們實現了圖片的文字識別和提取,本章基於javacv中的tesserac 和ffmpeg實現視頻文字識別和提取
javacv中包含ffmpeg和tesserac兩個庫以及tesserac的依賴庫leptonica。
讀取視頻幀javacv已經幫我們封裝好了,直接就可以讀取到視頻幀,麻煩的是,測試的時候發現javacv設置像素格式不起效果,所以我們只能通過BufferedImage進行轉換后才能進行圖片文字識別,性能上肯定會有折扣,后面我會放出基於ffmpeg的解碼並轉換為rgb像素后提供給tesserac進行識別。
那么,就讓我們開始吧。
注意:由於我們是每一幀都進行識別,而且視頻播放和識別是相同線程,會阻塞,所以視頻播放速度會很慢。
實現功能
1、視頻讀取
2、視頻幀獲取
3、視頻幀轉換為java的BuffredImage圖片
4、圖片轉像素
5、使用像素數據進行tesserac ocr文字識別
完整閱讀本章:https://eguid.blog.csdn.net/article/details/106044521
---end---