原始圖片:
純數字,帶有傾斜角度。
處理后如下圖:
現在識別就是簡單的用 knn, 而且樣本就只有0-9是個樣本,仿宋字體的。
也看了ocrad.js和GOCR.js兩個庫,挺好
具體應用是因為一個想實現下識別的算法,另一個是用下canvas,就應用方面來講,是因為有人在工作中要批處理pdf圖片,提取其中的某些值來計算,當然自己實現就可以根據具體的業務來定制。
為什么人腦對於圖像處理會這么聰明,這么的快,很好奇。
反正也是自己想實現下而已,下篇寫下具體實現和一些坑。