1.直方圖
用於計算圖片特征,表達, 使得數據具有總結性, 顏色直方圖對數據空間進行量化,好比10個bin
2. 聚類
類內對象的相關性高
類間對象的相關性差
常用算法:kmeans, EM算法, meanshift, 譜聚類(密度聚類), 層次聚類
kmeans聚類
選取k個類中心,隨機選取
計算每個點跟k個類中心的位置
把數據點分配給距離最近的一個類中心
計算新的類中心-對該類中的所有點取均值
類中心數K的選取
K類平均質心的距離加權平均值, 當k=5時的斜率發生變化,我們可以選取5作為分類的個數
kmeans ++ 半隨機(初始點的選取)
第一類中心 - 隨機選取
記D(x) 為數據點x距離最近的聚類中心的距離
選取下一個聚類中心, 選取的概率正比於D(x) ^ 2
以此類推,到第k個
量化顏色直方圖
聚類顏色直方圖: 使用聚類算法對像素點顏色向量進行聚類, 單元由聚類中心代表
3. 邊緣檢測
像素明顯變化的區域, 具有豐富的語義信息
用途: 物體識別,幾何視角變化
定義: 像素函數快速變化的區域, 一階導數的極值區域,二階導數的0點位置
步驟:
先高斯去噪,再使用一階導數獲取極值
公式: 對x方向進行求導 б 表示的是標准差 對y方向進行求導
梯度幅值/強度
hx(x,y)^ 2 + hy(x, y) ^ 2
梯度(增加最快)方向
arctan(hy(x, y)/ hx(x, y))
4. 興趣點/關鍵點
穩定局部
特點: 可重復性,顯著性
抗圖片變化
外貌變化(亮度,光照)
幾何變化(平移, 選擇,尺度)
5.Harris角點
一種顯著點:在任何方向上移動小觀察窗,導致大的像素變動
E(u, v) = ΣW(x, y)[I(x+u, y+v)-I(x, y)] ^2
W(x, y)是高斯函數進行加權的, x,y表示當前位置, u和v表示移動了的位置
6.斑點(Blob)
拉普拉斯梯度:一階導數極值點 - 二階導數零點
梯度/邊緣可以通過查找:二階導數接近零, 一階導數足夠大
對噪聲很敏感, 需要先做高斯平滑
公式: Δf = δ2f / δ2x + δ2f / δ2y 對x求二階導, 對y方向求二階導
斑點是找拉普拉斯的極值
邊緣是找拉普拉斯的零值
7.SIFT
SIFT特征計算
計算高斯差分(DoG)尺度空間,獲取極值點
特征點處理: 位置插值, 去除低對比度點, 去除邊緣點
方向估計: 2*2網格, 8個方向,獲得最高值為關鍵點的主方向,特征點方向歸一化,即所有方向為同一方向
描述子提取: 在旋轉坐標上采樣16*16的像素窗, 4*4網格,8方向直方圖,總共178維
8.紋理特征
HOG(方向梯度直方圖)
梯度幅值,方向 s = sqrt(sx^2 + sy^2)
Block 拆分
16*16的block 步長是8, 包含2*2個cell, 每個cell8*8, 9個方向
積累梯度幅值,使用位置高斯加權,使用相鄰bin線性插值
64&128的維度圖:7*15 * (2*2) * 9 = 3780
LBP(局部二值模式)
將每個像素點與周圍點大小半徑比較,半徑R的圓上,均勻采樣P個點,根據赫值大小,量化為0或1