javaCV文字識別之2:視頻文字識別和視頻提取字幕文字字符


javacv文字識別系列:

javaCV文字識別之1:基於google的tesserac ocr識別圖片中的文字,跨平台支持英文中文簡體繁體等各種字符識別

javaCV文字識別之2:視頻文字識別和視頻提取字幕文字字符

前言

上一章我們實現了圖片的文字識別和提取,本章基於javacv中的tesserac 和ffmpeg實現視頻文字識別和提取

javacv中包含ffmpeg和tesserac兩個庫以及tesserac的依賴庫leptonica。

讀取視頻幀javacv已經幫我們封裝好了,直接就可以讀取到視頻幀,麻煩的是,測試的時候發現javacv設置像素格式不起效果,所以我們只能通過BufferedImage進行轉換后才能進行圖片文字識別,性能上肯定會有折扣,后面我會放出基於ffmpeg的解碼並轉換為rgb像素后提供給tesserac進行識別。

那么,就讓我們開始吧。

注意:由於我們是每一幀都進行識別,而且視頻播放和識別是相同線程,會阻塞,所以視頻播放速度會很慢。

實現功能

1、視頻讀取

2、視頻幀獲取

3、視頻幀轉換為java的BuffredImage圖片

4、圖片轉像素

5、使用像素數據進行tesserac ocr文字識別

 

完整閱讀本章:https://eguid.blog.csdn.net/article/details/106044521

 

 

---end---


免責聲明!

本站轉載的文章為個人學習借鑒使用,本站對版權不負任何法律責任。如果侵犯了您的隱私權益,請聯系本站郵箱yoyou2525@163.com刪除。



 
粵ICP備18138465號   © 2018-2025 CODEPRJ.COM