OCR的概念是在1929年由德國科學家Tausheck最先提出來的,后來美國科學家Handel也提出了利用技術對文字進行識別的想法。而最早對印刷體漢字識別進行研究的是IBM公司的Casey和Nagy,1966年他們發表了第一篇關於漢字識別的文章,采用了模板匹配法識別了1000個印刷體漢字。

如何預處理?



如何實現文本行檢測?

如何實現文本行檢測-CTPN ?

如何實現文本行檢測-EAST ?

如何實現文本行檢測-AdvancedEAST ?

AdvancedEAST - 訓練算法網絡

AdvancedEAST - 總覽

AdvancedEAST - 預處理

AdvancedEAST - 開始訓練

AdvancedEAST - 樣本數據
數據決定預測的上限,而算法只是逼近這個上限
AdvancedEAST - 模型訓練

性能測試

AdvancedEAST - 性能優化

AdvancedEAST - 准確性評估

