caffe学习记录(九) CRNN+BLSTM+CTC OCR识别,后续加上SSD做检测


https://github.com/senlinuc/caffe_ocr源代码在此,是基于senlnuc的模型进行学习的。

好长时间没更新学习博客了,之前一直在忙着做基网络模型的评测,以及tesseract 和其他Ocr的研究等。

更新一下最近学习的OCR检测,要求是速度要快,准确度要相对较高!

整个操作流程:

先用卷积进行特征提取,这里我用的是Densenet的模型,然后用双Lstm进行不定长处理,然后接上warp-ctc进行去重定向。

作者中文字符识别的准确率如下表:

我是基于linux进行的英文自然场景英文识别,目前还在识别的训练阶段,接下来会加上自然场景的检测,暂定用mobileNet-ssd。训好后会放出评测

 


免责声明!

本站转载的文章为个人学习借鉴使用,本站对版权不负任何法律责任。如果侵犯了您的隐私权益,请联系本站邮箱yoyou2525@163.com删除。



 
粤ICP备18138465号  © 2018-2025 CODEPRJ.COM