javaCV文字識別之2：視頻文字識別和視頻提取字幕文字字符

本文轉載自查看原文 2020-05-13 09:28 1008 javacv

javacv文字識別系列：

javaCV文字識別之1：基於google的tesserac ocr識別圖片中的文字，跨平台支持英文中文簡體繁體等各種字符識別

javaCV文字識別之2：視頻文字識別和視頻提取字幕文字字符

前言

上一章我們實現了圖片的文字識別和提取，本章基於javacv中的tesserac 和ffmpeg實現視頻文字識別和提取

javacv中包含ffmpeg和tesserac兩個庫以及tesserac的依賴庫leptonica。

讀取視頻幀javacv已經幫我們封裝好了，直接就可以讀取到視頻幀，麻煩的是，測試的時候發現javacv設置像素格式不起效果，所以我們只能通過BufferedImage進行轉換后才能進行圖片文字識別，性能上肯定會有折扣，后面我會放出基於ffmpeg的解碼並轉換為rgb像素后提供給tesserac進行識別。

那么，就讓我們開始吧。

注意：由於我們是每一幀都進行識別，而且視頻播放和識別是相同線程，會阻塞，所以視頻播放速度會很慢。

實現功能

1、視頻讀取

2、視頻幀獲取

3、視頻幀轉換為java的BuffredImage圖片

4、圖片轉像素

5、使用像素數據進行tesserac ocr文字識別

完整閱讀本章：https://eguid.blog.csdn.net/article/details/106044521

---end---

免責聲明！

本站轉載的文章為個人學習借鑒使用，本站對版權不負任何法律責任。如果侵犯了您的隱私權益，請聯系本站郵箱yoyou2525@163.com刪除。

猜您在找 【OCR識別】如何實現實時視頻文案轉文字、音頻歌詞字幕提取和翻譯？視頻提取文字，動態識別提取文字並導出Excel... Pr 給視頻添加字幕或文字三種語音識別方法幫助你快速語音轉文字（視頻識別文字）如何根據音頻轉文字自動給視頻加字幕 javaCV文字識別之1：基於google的tesserac ocr識別圖片中的文字，跨平台支持英文中文簡體繁體等各種字符識別 Tesseract識別圖片提取文字&字庫訓練 pytesseract提取識別圖片中的文字 js實現文字字幕滾動如何自動提取視頻、音頻的內容（轉文字）防止識別圖片中文字；防止圖片文字提取；反抗圖片文字提取