https://github.com/senlinuc/caffe_ocr源代碼在此,是基於senlnuc的模型進行學習的。
好長時間沒更新學習博客了,之前一直在忙着做基網絡模型的評測,以及tesseract 和其他Ocr的研究等。
更新一下最近學習的OCR檢測,要求是速度要快,准確度要相對較高!
整個操作流程:
先用卷積進行特征提取,這里我用的是Densenet的模型,然后用雙Lstm進行不定長處理,然后接上warp-ctc進行去重定向。
作者中文字符識別的准確率如下表:
我是基於linux進行的英文自然場景英文識別,目前還在識別的訓練階段,接下來會加上自然場景的檢測,暫定用mobileNet-ssd。訓好后會放出評測