第七篇:字符特征
選擇的字符特征應該滿足以下條件:
(1)選取的字符特征具有較強的魯棒性,不受字符變形、彎曲等影響。
(2)兩個字符的字符特征不能完全相同,但部分相同是允許的,即選擇的字符特征是唯一的,但是不能重復。
(3)選取的字符特征要盡可能的提供字符的信息。
(4)選擇的字符特征提取方法易於實現,能夠減少計算時間。
一般采用紋理、邊緣特征。紋理特征是表示圖像的另一種重要的視覺特征,紋理結構反映圖像亮度的空間變化情況,具有局部與整體的自相似性。紋理是有紋理基元按某種確定性的規律或某種統計規律排列組成的,在紋理區域內各部分具有大致相同的結構。
提取特征的的方法:
(1)逐像素特征提取是指對整幅二值圖像進行掃描,若圖像中的像素點為黑色像素點時,則令特征值為 1,否則特征值為 0。經過該方法提取的特征向量的維數與圖像中的像素點的個數相同。
(2)骨架特征提取是先細化字符圖像,然后從細化后的字符圖像中逐像素地提取特征。
此方法適用不同大小的字符。
(3)垂直方法數據統計特征提取是首先對字符圖像進行水平投影,統計水平投影值,此處的水平投影值為黑色像素的數目;然后通過對字符圖像進行垂直投影,統計垂直投影值,此處的垂直投影值仍為黑色像素的個數;最后將水平和垂直投影值作為字符的特征向量。
(4)13 點特征提取方法的總體思路是:首先把字符平均分成 8 份,統計每一份黑色
像素點的個數作為 8 個特征。分別統計這 8 個區域中的黑色像素的數目,就可以得到 8 個特征;然后統計水平方向中間兩行和垂直方向中間兩列的黑色像素點的個數作為 4 個特征;最后統計所有黑色像素點的個數作為 13 個特征。
常用的特征求取:
一、粗網格特征:
將歸一化后的字符圖像等分成 8×8 網格,統計各網格內黑像素的數量,取得一個 64 維的網格特征。
外圍特征:提取字符外圍特征的步驟為:
① 把歸一化后的點陣圖形等分為 8 行。
② 計算每一行中點從圖像左邊緣至第一項由白變黑的長度(如果沒有由白變黑的點,則默認為零)。
③ 再計算每一行中點從圖像左邊緣至第二項由白變黑的長度(如果沒有由白變黑的點,則默認為零)。
④ 仿照上面 3 個步驟,提取其它 3 個邊緣的特征。
采用上述方法可以提取另一個 4×2×8=64 維的外圍特征。
通過采用基於像素數量的粗網格特征與外圍特征相結合方法可以提取字符的128 維特征,用以字符識別。
二、PCA進行漢字識別,網格特征進行數字和字母的提取。
網格特征是指通過把二值化后的字符分成M×N個網格,統計每一個網格中的字符像素數量,把各個網格中的像素數量組合起來作為字符的網格特征來識別字符。字母數字相對於漢字來說筆畫簡單,也極少出現字符輪廓模糊的現象。因此,字母數字的識別相對來說比較簡單。但是,字母數字之間存在相似字符的比例較高,而且相似字符之間的差異又比較小,很容易識別錯。對字母數字的識別論文采用了二次識別的思想。
三、均勻網格特征
統計黑像素點在每個網格中所占的比例,屬於統計特征中局部特征的一種,體現了文字點陣的整體形狀的分布。它將字符圖像二值化以后,再把樣本字符圖像分成mxn個M格,並統計每個網格中屬於文字點陣的像數量,記為i;統計整個圖像巾屈於文字點陣的像素數量,記為j;計算各個網格中的文字點陣的像素數量整個像中文字點陣的像素數量之比P=i/j將每個網格統汁的百分比P組合起來作為字符的統計特征,用以實現對字符的識別。好個網格屮的文字點陣比例反映了文字筆畫在二維平面空間的分布特征。
網格特征的統計是以網格為單位進行的,即使個別像素點的統計有誤差也不會對識別結果造成很大的影響,該特征還具有較強的區分相似字符的能力。此特征提取算法比較簡單,計算速率很快,且易於實現,但其對字符圖像配准要求較高,故需要在提取字符圖像的特征之前,對圖像進行去邊框等預處理操作。此算法更適合印刷體等較規則的字體,而不適用於手寫體。
四、LBP特征進行漢字識別
預處理模塊對圖像進行歸一化操作;第二個模塊計算出圖像中每個像素點的LBP值;第三個模塊用於將圖像平均分割為MxN個網格;最后一個模塊用於計算各塊的LBP特征。
1、傳統的LBP算法是基於3 X 3的窗口的,對應於9個灰度值。將該窗口的8鄰域的灰度值與中心像素的灰度值比較,小於中心灰度值的像素點的置為0,反之將其置為1;然后,通過逆吋針或者順時針將這8個二進制數轉化為一個二進制序列,並求出其對應的十進制值,作為這個3X3窗口的中心像素點的特征值。即各像素點的LBP值。
2、將每個像素點的LBP值齊代它的灰度值,得到LBP閣像。並將LBP圖像分塊,對每個分塊進行直方圖統計。如,將LBP圖像分為4*8塊,每塊大小為8*8。在每個分塊內,將0-255的LBP值量化為32級,並進行直方圖統計。即每個分塊的LBP特征為32維。
3、將各個小塊的LBP特征連起來,獲得(4*8)*32=1024維的一個矢量,該矢量即為字符圖像的LBP特征。
改進的LBP特征:
均勻模式:它們有一個共同點,即在LBP二值編碼序列巾,最多有兩個0到1或1到0的變化。LBP二值編碼序列為11000001,從1到0的變化為1次,從0到1的變化為1次,即它的均勻性U(LBP)=2。滿足U(LBP)<=2的所有模式稱為均勻模式。在8鄰域中,滿足U(LBP)<=2的所有模式的個數為8*(8-1)+2,具體的LBP二值編碼序列與i/(Z及TMH]對應圖見圖2-16。再進一步將它們旋轉到最小值后,具有旋轉不變性的均勾模式(Rotation Invariant Uniform Pattern)的個數則為8+1。
模式對應的LBP二進制中從0變化為1和從1變化為0的次數之和小於等於兩次,則該模式就是均勻模式。再根據順時針或逆時針方向讀出8個二進制數作為一個二進制序列,計算其對應的十進制值,作為該3X 3矩形的中心元的特征值。反之,則該模式就不是均勻模式,它們的LBP值均為8+1。
由於改進的LBP特征是用58種均勻模式和統一后的一種非均勻模式來表示的。即在每個分塊內,將0-255的LBP倍轉化為59級。將這59級量化到0-63、64-127、128-191、192-255這四個區間中,並進行直方圖統計。即每個分塊的LBP特征為4維。
將各個小塊的LBP特征連起來,獲得(4*8) *4=128維的一個矢量,矢量即為字符圖像的LBP特征。均勻模式時的LBP特征向量維數=圖像分塊數*59,改進的LBP特征向量維數=圖像分塊數*4,大大地提高了識別速率。