花費 56 ms
【OCR技術系列之四】基於深度學習的文字識別(3755個漢字)

上一篇提到文字數據集的合成,現在我們手頭上已經得到了3755個漢字(一級字庫)的印刷體圖像數據集,我們可以利用它們進行接下來的3755個漢字的識別系統的搭建。用深度學習做文字識別,用的網絡當然是CNN ...

Mon Feb 12 04:08:00 CST 2018 103 75847
【OCR技術系列之八】端到端不定長文本識別CRNN代碼實現

CRNN是OCR領域非常經典且被廣泛使用的識別算法,其理論基礎可以參考我上一篇文章,本文將着重講解CRNN代碼實現過程以及識別效果。 數據處理 利用圖像處理技術我們手工大批量生成文字圖像,一共36 ...

Fri Feb 01 19:44:00 CST 2019 75 25864
【OCR技術系列之七】端到端不定長文字識別CRNN算法詳解

在以前的OCR任務中,識別過程分為兩步:單字切割和分類任務。我們一般都會講一連串文字的文本文件先利用投影法切割出單個字體,在送入CNN里進行文字分類。但是此法已經有點過時了,現在更流行的是基於深度學習 ...

Wed Jan 30 04:21:00 CST 2019 5 24666
【OCR技術系列之一】字符識別技術總覽

最近入坑研究OCR,看了比較多關於OCR的資料,對OCR的前世今生也有了一個比較清晰的了解。所以想寫一篇關於OCR技術的綜述,對OCR相關的知識點都好好總結一遍,以加深個人理解。 什么是OCR? ...

Thu Nov 30 06:12:00 CST 2017 11 36828
【OCR技術系列之二】文字定位與切割

要做文字識別,第一步要考慮的就是怎么將每一個字符從圖片中切割下來,然后才可以送入我們設計好的模型進行字符識別。現在就以下面這張圖片為例,說一說最一般的字符切割的步驟是哪些。 當然,我們實際上要識 ...

Wed Dec 13 04:41:00 CST 2017 9 35672
【OCR技術系列之三】大批量生成文字訓練集

放假了,終於可以繼續可以靜下心寫一寫OCR方面的東西。上次談到文字的切割,今天打算總結一下我們怎么得到用於訓練的文字數據集。如果是想訓練一個手寫體識別的模型,用一些前人收集好的手寫文字集就好了,比如中 ...

Sat Feb 10 05:07:00 CST 2018 21 26031
【OCR技術系列之六】文本檢測CTPN的代碼實現

這幾天一直在用Pytorch來復現文本檢測領域的CTPN論文,本文章將從數據處理、訓練標簽生成、神經網絡搭建、損失函數設計、訓練主過程編寫等這幾個方面來一步一步復現CTPN。CTPN算法理論可以參考這 ...

Mon Dec 03 01:59:00 CST 2018 52 13367

 
粵ICP備18138465號   © 2018-2025 CODEPRJ.COM