CogOCRMaxTool工具的功能原理
CogOCRMaxTool是字符讀取工具,能夠根據已訓練的字符樣本讀取灰度圖像中的字符,並返回讀取結果。在使用COgOCRMaxtool工具讀取字符的時候,需要設置字符區域,每個字符的最大最小寬度等參數。在字符讀取之前需要首先進行字符分割和字符訓練,下面分別進行介紹:
1) 字符分割:
字符分割的過程就是將字符像素從背景像素中分離出來,然后將這些分離后的字符像素分割成獨立的符號,CogOCRMaxTool工具支持一套參數,這些參數指示如何把字符和背景以及字符和字符分割開,這些參數的設置需要考慮多種因素,如字符之間的距離、字符的種類、圖像的質量等,通常情況下,默認的分割參數不能將字符充分分割。需要不斷的嘗試着修改分割參數,直到字符能夠充分分割。
2) 字符分類
字符分類的過程就是為每一個分割的字符訓練一個最佳匹配字符。新添加CogOCRMaxTool工具是沒有訓練字符的。可以從文件中調用已經存在的字符文件或臨時添加字符集,添加字符集是一個不斷重復的過程,需要添加所有需要讀取的字符,只有在訓練字符集中存在的字符才能夠被成功讀取。對於未訓練的字符則不能成功讀取。