caffe學習記錄(九) CRNN+BLSTM+CTC OCR識別,后續加上SSD做檢測


https://github.com/senlinuc/caffe_ocr源代碼在此,是基於senlnuc的模型進行學習的。

好長時間沒更新學習博客了,之前一直在忙着做基網絡模型的評測,以及tesseract 和其他Ocr的研究等。

更新一下最近學習的OCR檢測,要求是速度要快,准確度要相對較高!

整個操作流程:

先用卷積進行特征提取,這里我用的是Densenet的模型,然后用雙Lstm進行不定長處理,然后接上warp-ctc進行去重定向。

作者中文字符識別的准確率如下表:

我是基於linux進行的英文自然場景英文識別,目前還在識別的訓練階段,接下來會加上自然場景的檢測,暫定用mobileNet-ssd。訓好后會放出評測

 


免責聲明!

本站轉載的文章為個人學習借鑒使用,本站對版權不負任何法律責任。如果侵犯了您的隱私權益,請聯系本站郵箱yoyou2525@163.com刪除。



 
粵ICP備18138465號   © 2018-2025 CODEPRJ.COM