hog特征及其提取方法圖示


1 什么是hog特征

hog特征是histogram of gradient的縮寫。我們觀察圖像時,信息更多來自目標邊沿的突變。我們計算一塊區域內的所有像素處的梯度信息,即突變的方向和大小,然后對360度進行划分,得到多個bin,統計該區域內的所有像素所在的bin,就得到了一個histogram。這就是hog特征。

2 hog特征的提取方法

2.1 將彩色圖像轉換為灰度圖像

2.2 Gamma歸一化

2.3 計算每幅圖像的梯度

2.3.1 梯度分量的計算

水平模板:[-1,0,1],水平方向以水平向右為正方向

豎直模板:[1, 0, -1]^T,豎直方向以豎直向上為正方向

2.3.2 梯度的計算

如上圖所示,計算出alpha和beta,然后alpha屬於[0, 45度)的bin,beta屬於[270度, 315)度的bin。

alpha = arctan(y/x)

beta = 360度 - arctan(y/x)

其中x和y是該梯度分別沿x軸和y軸的分量的模值。

 

2.4 將圖像划分為多個cell,每個cell是6像素*6像素,然后每2*2的cell構成一個block

 

 

2.5 對每個cell中的每個像素的梯度按照方向統計直方圖,360度bin的划分如下,這里進行了8等分

2.6 cell直方圖的計算

分別得到落入[0, 45) [45, 90) [90, 135) [135, 180) [180, 225) [225, 270) [270, 315) [315, 360)的梯度,然后把每個bin中的梯度的模值相加,就得到了該bin的分量。

這樣就得到了一個cell的特征,即一個8維的向量。

2.7 block特征的計算

將block中的cell的所有特征串聯起來,構成該block的特征,然后歸一化,就是說,把每個特征除以該特征向量的模值,歸一化是為了消除光照的影響。這樣每個block是一個8*4=32維的向量。

2.8 block是可以重疊的,block中的cell不重疊

也就是說,對於整個image而言,block可以重疊,比如說步長是8個像素,那么從0開始到11是一個block,然后從8開始到19是一個block,從16開始到27是一個block,它們之間是有重疊的。

2.9 最終的特征向量

將所有的block的特征向量串聯起來就是最終的特征向量了,即hog特征。

 


免責聲明!

本站轉載的文章為個人學習借鑒使用,本站對版權不負任何法律責任。如果侵犯了您的隱私權益,請聯系本站郵箱yoyou2525@163.com刪除。



 
粵ICP備18138465號   © 2018-2025 CODEPRJ.COM