圖像特征提取：圖像的矩特征

本文轉載自查看原文 2014-09-28 20:30 3624 圖像處理/圖像增強等/ 算法alg

1. 矩的概念

圖像識別的一個核心問題是圖像的特征提取，簡單描述即為用一組簡單的數據（圖像描述量）來描述整個圖像，這組數據越簡單越有代表性越好。良好的特征不受光線、噪點、幾何形變的干擾。圖像識別發展幾十年，不斷有新的特征提出，而圖像不變矩就是其中一個。

矩是概率與統計中的一個概念，是隨機變量的一種數字特征。設

比較重要的有兩種情況：

一階原點矩就是期望。一階中心矩

針對於一幅圖像，我們把像素的坐標看成是一個二維隨機變量

不變矩(Invariant Moments)是一處高度濃縮的圖像特征，具有平移、灰度、尺度、旋轉不變性。M.K.Hu在1961年首先提出了不變矩的概念。1979年M.R.Teague根據正交多項式理論提出了Zernike矩。下面主要介紹這兩種矩特征的算法原理與實現。

2. Hu矩

一幅

m p q = \sum i = 1 M \sum j = 1 N i p j q f (i, j)

μ p q = \sum i = 1 M \sum j = 1 N (i - i ¯) p (j - j ¯) q f (

其中

若將

為了消除圖像比例變化帶來的影響，定義規格化中心矩如下：

η p q = μ p a μ γ 00 , ( γ = p + q 2 , p + q = 2 , 3 , \dots )

利用二階和三階規格中心矩可以導出下面7個不變矩組

3. 利用OpenCV計算Hu矩

opencv里對Hu矩的計算有直接的API，它分為了兩個函數：moments()函數用於計算中心矩，HuMoments函數用於由中心矩計算Hu矩。

Moments moments(InputArray array, bool binaryImage=false )

參數說明

輸入參數：array是一幅單通道，8-bits的圖像，或一個二維浮點數組(Point of Point2f)。binaryImage用來指示輸出圖像是否為一幅二值圖像，如果是二值圖像，則圖像中所有非0像素看作為1進行計算。
輸出參數：moments是一個類：

class Moments { public: Moments(); Moments(double m00, double m10, double m01, double m20, double m11, double m02, double m30, double m21, double m12, double m03 ); Moments( const CvMoments& moments ); operator CvMoments() const;

里面保存了圖像的2階與3階中心矩的值。

void HuMoments(const Moments& moments, double* hu)

參數說明：

輸入參數：moments即為上面一個函數計算得到的moments類型。
輸出參數：hu是一個含有7個數的數組。

int main(int argc, char** argv)
{
    Mat image = imread(argv[1]);
    cvtColor(image, image, CV_BGR2GRAY);
    Moments mts = moments(image);
    double hu[7];
    HuMoments(mts, hu);
    for (int i=0; i<7; i++)
    {
        cout << log(abs(hu[i])) <<endl;
    }
   return 0;
}

上面代碼中，最終輸出的值為

我們分別計算一幅圖像在，旋轉，噪聲與模糊時的Hu矩。

類別
原圖	-6.76181	-19.1286	-23.7441	-26.776	-51.7618	-35.8491	-51.534
旋轉	-6.72102	-19.0844	-23.5756	-25.9122	-51.4619	-35.4595	-50.7674
加放噪點	-6.76086	-19.1255	-23.7611	-26.3228	-51.5056	-35.895	-51.6321
模糊	-6.76183	-19.1295	-23.7451	-26.2767	-51.765	-35.8484	-51.5307

4. Zernike矩

Hu矩在圖像描述上有廣泛的應用，但是其低階幾何矩與圖像整體特征有關，不包含太多的圖像細節信息，而高階幾何矩易受噪聲影響，因此很難利用幾何矩恢復圖像。

Zernike矩能夠很容易地構造圖像的任意高階矩，並能夠使用較少的矩來重建圖像。Zernike矩是基於Zernike多項式的正交化函數，雖然其計算比較復雜，但是Zernide矩在圖像旋轉和低噪聲敏感度方面具有較大的優越性。由於Zernike矩具有圖像旋轉不變性，而且可以構造任意高階矩，所以被廣泛應用對目標進行識別中。

4.1 Zernike矩多項式

首先要弄清楚什么是正交多項式。若函數

對於一個多項式的序列

若

那么正交多項式有什么作用呢？答案是：逼近！正交多項式相當於基，任何一個n維多項式函數

Zernike在1934年提出了在單位圓上定義的一組正交多項式，即Zernike正交多項式，其定義形式為：

R n m (ρ) = \sum s = 0 (n - | m |) / 2 ( - 1 ) s [ ( n -

V n m (x, y) = V n m (ρ, θ) = R n m (ρ) e j m θ

其中

Zernike多項式

R n m (ρ) = [ ( K 2 2 ρ 2 + K 3 ) R ( n - 2 ) m ( ρ ) + K 4 R

R m m (ρ) = ρ m

式中：

4.2 Zernike矩的定義

由於Zernike多項式的正交完備性，所以在單位圓內的任何圖像

f (x, y) = \sum n = 0 \infty \sum m = 0 \infty Z n m V n, m (ρ, θ)

上式中的

對二維函數

Z n m = n + 1 π \int 1 0 \int 2 π 0 [ V n m ( ρ , θ ) ] f ( ρ

= n + 1 π \iint R n m ( ρ ) e j m θ f ( ρ , θ ) d ρ d θ

式中

4.3 Zernike矩的計算

從Zernike矩的計算公式上來看，對於二維圖像，其Zernike矩

C n m = 2 n + 2 π \int 1 0 \int 2 π 0 [ R n m ( ρ ) c o s ( m

C n m = 2 n + 2 π \int 1 0 \int 2 π 0 [ R n m ( ρ ) s i n ( m

因為數字圖像是離散形式的點，所以需要將上式離散化，把積分號換為求和號，但是需要作一些坐標變換。

對於

如果

σ = 2 ( r - x ) y | y | + x y r

如果

σ = 2 y - x y r

我們容易計算出，

ρ = 2 r / N, θ = π σ (4 r)

所以，最終我們得到離散化的Zernike矩的計算公式：

C n m = 2 n + 2 N 2 \sum r = 1 N / 2 R n m ( 2 r / N ) \sum

S n m = 2 n + 2 N 2 \sum r = 1 N / 2 R n m ( 2 r / N ) \sum

1. 確定圖像的大小

2. 確定

3. 利用Zernike多項式的遞推性質計算各階

4. 對

現在我們用Zernike矩來計算美女圖像在4種狀態下的值：

類別
原圖	11.1732	13.8469	12.3515	12.4391	14.2782	12.6137	11.5745
旋轉	12.3036	13.8309	13.5861	12.0467	13.1320	13.8396	12.7862
加放噪點	11.1538	13.8490	12.3315	12.4316	14.2730	12.5925	11.5591
模糊	11.1636	13.8465	12.3480	12.4367	14.2799	12.6130	11.5752

通過表中，可以看出，Zernike在總體上效果比Hu矩更好（PS:感覺在旋轉上好像差強人意！）

下面是Zernike矩的matlab實現[來自《現代數字圖像-處理技術提高及應用案例詳解》]，這里偷懶了，有機會的話會把C++版的實現補上。

View Code

5. 總結

不變矩的應用過程一般包括：

選擇合適的不變矩類型；
選擇分類器（如神經網絡、最短距離等）；
如果是神經網絡分類器，則需要計算學習樣例的不變矩去訓練神經網絡；
計算待識別對象的不變矩，輸入神經網絡就可得到待識別對象的類型，或者計算待識別對象不變矩與類別對象不變矩之間的距離，選擇最短距離的類別作為待識別對象的類別。

可以看出，不變矩作用主要目的是描述事物（圖像）的特征。人眼識別圖像的特征往往又表現為“求和”的形式，因此不變矩是對圖像元素進行了積分操作。

不變矩能夠描述圖像整體特征就是因為它具有平移不變形、比例不變性和旋轉不變性等性質。

然而，另一方面圖像的各階不變矩究竟代表的什么特征很難進行直觀的物理解釋。

6. 參考資料

[1] 《現代數字圖像處理》（matlab版）

[2] 正交多項式WIKI

[3] opencv形態描述

免責聲明！

本站轉載的文章為個人學習借鑒使用，本站對版權不負任何法律責任。如果侵犯了您的隱私權益，請聯系本站郵箱yoyou2525@163.com刪除。

猜您在找 關於圖像特征提取【轉】 python圖像特征提取圖像特征提取--綜述 paper 1：圖像特征提取圖像局部特征提取圖像特征提取之（一）HOG特征圖像特征提取之Haar特征圖像的矩特征圖像預處理（一）基本特征提取圖片特征提取 | 圖像識別