標簽【OCR系列】 - 碼上歡樂

上一篇提到文字數據集的合成，現在我們手頭上已經得到了3755個漢字（一級字庫）的印刷體圖像數據集，我們可以利用它們進行接下來的3755個漢字的識別系統的搭建。用深度學習做文字識別，用的網絡當然是CNN ...

文字識別分為兩個具體步驟：文字的檢測和文字的識別，兩者缺一不可，尤其是文字檢測，是識別的前提條件，若文字都找不到，那何談文字識別。今天我們首先來談一下當今流行的文字檢測技術有哪些。文本檢測不是一件 ...

CRNN是OCR領域非常經典且被廣泛使用的識別算法，其理論基礎可以參考我上一篇文章，本文將着重講解CRNN代碼實現過程以及識別效果。數據處理利用圖像處理技術我們手工大批量生成文字圖像，一共36 ...

在以前的OCR任務中，識別過程分為兩步：單字切割和分類任務。我們一般都會講一連串文字的文本文件先利用投影法切割出單個字體，在送入CNN里進行文字分類。但是此法已經有點過時了，現在更流行的是基於深度學習 ...

最近入坑研究OCR，看了比較多關於OCR的資料，對OCR的前世今生也有了一個比較清晰的了解。所以想寫一篇關於OCR技術的綜述，對OCR相關的知識點都好好總結一遍，以加深個人理解。什么是OCR？ ...

要做文字識別，第一步要考慮的就是怎么將每一個字符從圖片中切割下來，然后才可以送入我們設計好的模型進行字符識別。現在就以下面這張圖片為例，說一說最一般的字符切割的步驟是哪些。當然，我們實際上要識 ...

放假了，終於可以繼續可以靜下心寫一寫OCR方面的東西。上次談到文字的切割，今天打算總結一下我們怎么得到用於訓練的文字數據集。如果是想訓練一個手寫體識別的模型，用一些前人收集好的手寫文字集就好了，比如中 ...

這幾天一直在用Pytorch來復現文本檢測領域的CTPN論文，本文章將從數據處理、訓練標簽生成、神經網絡搭建、損失函數設計、訓練主過程編寫等這幾個方面來一步一步復現CTPN。CTPN算法理論可以參考這 ...