基於模糊集理論的一種圖像二值化算法的原理、實現效果及代碼

本文轉載自查看原文 2013-09-05 11:05 7982 模糊集/ 二值化/ 香農熵/ [04] 圖像識別相關/ [08] 圖像二值相關

　　這是篇很古老的論文中的算法，發表與1994年，是清華大學黃良凱（Liang-kai Huang) 所寫，因此國外一些論文里和代碼里稱之為Huang's fuzzy thresholding method。雖然古老也很簡單，但是其算法的原理還是值得學習的。

該論文的原文可從此處下載： Image thresholding by minimizing the measure of fuzziness。

該論文結合了當時處於研究熱潮的模糊集理論，提出了一種具有較好效果的圖像二值化算法，本文主要是對其進行簡單的翻譯和注釋，並提供了測試代碼。

一、模糊集及其隸屬度函數

首先，我們假定X代表一副大小為M×N的具有L個色階的灰度圖像，而x_mn代表圖像X中點（m,n)處的像素灰度值，定義μ_x(x_mn)表示該點具有某種屬性的隸屬度值，也就是說我們定義了一個從圖像X映射到[0,1]區間的模糊子集，用專業的模糊集表達，即有：

其中0≤μ_x(x_mn)≤1，m=0,1,...M-1，n=0,1,...N-1。對於二值化來說，每個像素對於其所屬的類別（前景或背景）都應該有很相近的關系，因此，我們可以這種關系來表示μ_x(x_mn)的值。

定義h(g)表示圖像中具有灰度級g的像素的個數，對於一個給定的閾值t,背景和前景各自色階值的平均值μ₀和μ₁可用下式表示：

上述μ₀和μ₁，可以看成是指定閾值t所對應的前景和背景的目標值，而圖像X中某一點和其所述的區域之間的關系，在直覺上應該和該點的色階值與所屬區域的目標值之間的差異相關。因此，對於點(m,n)，我們提出如下的隸屬度定義函數：

　　其中C是一個常數，該常數使得0.5≤μ_x(x_mn)≤1。因此，對於一個給定的閾值t，圖像中任何一個像素要么屬於背景，要么屬於前景，因此，每個像素的隸屬度不應小於0.5。

C值在實際的編程中，可以用圖像的最大灰度值減去最小灰度值來表達，即 C=g_max-g_min;

　　二、模糊度的度量及取閾值的原則

模糊度表示了一個模糊集的模糊程度，有好幾種度量方式已經被提及了，本文僅僅使用了香農熵函數來度量模糊度。

基於香農熵函數，一個模糊集A的熵定義為：

其中香農函數：

擴展到2維的圖像，圖像X的熵可以表達為：

　　因為灰度圖像至多只有L個色階，因此使用直方圖式（7）可進一步寫成：

可以證明式（6）在區間[0,0.5]之間是單調遞增而在[0.5,1]之間是單調遞減的，並且E(X)具有以下屬性：

（1）0≤E(X)≤1 ;

(2)如果μ_x(x_mn)=0或者μ_x(x_mn)=1時，E(X)具有最小值0，在本文中μ_x(x_mn)只可能為1，此時分類具有最好的明確性。

（3）當μ_x(x_mn)=0.5，E(X)獲得最大值1，此時的分類具有最大的不明確性。

那么對於圖像X，我們確定最好的閾值t的原則就是：對於所有的可能的閾值t,取香農熵值最小時的那個t為最終的分割閾值。

三、編程中的技巧

有了上述原理，其實編程也是件很容易的事情了，你可以按照你的想法去做，不過作者論文中的闡述會讓代碼寫起來更清晰、更有效。

首先，為了表達方便，我們定義如下一些表達式：

根據上述表達式，可以知道S(L-1)及W(L-1)對於一副圖像來說是個常量，其中S(L-1)明顯就是像素的總個數。

　　我們的算法步驟如下：

（1）、計算S(L-1)、W(L-1)，設置初始閾值t=g_min,令S(t-1)=0、W(t-1)=0;

(2)、計算下面算式:

　稍微有點數學基礎的人都應該能看懂上述算式的推導原理。

根據式（2）和式（3），可以知道背景和前景的區域的平均灰度值為：

　　上式中int表示取整操作。

（3）根據式（4）及式（11）計算圖像的模糊度;

（4）令t=t+1，然后重新執行步驟2，直到t=g_max-1;

(5)找到整個過程中的最小模糊度值對應的閾值t，並作為最佳的分割閾值。

　　為了稍微加快點速度，上述式4中的計算可以在步驟1中用一查找表實現。

四、參考代碼：

public static int GetHuangFuzzyThreshold(int[] HistGram)
{
    int X, Y;
    int First, Last;
    int Threshold = -1;
    double BestEntropy = Double.MaxValue, Entropy;
    //   找到第一個和最后一個非0的色階值
    for (First = 0; First < HistGram.Length && HistGram[First] == 0; First++) ;
    for (Last = HistGram.Length - 1; Last > First && HistGram[Last] == 0; Last--) ;
    if (First == Last) return First;                // 圖像中只有一個顏色
    if (First + 1 == Last) return First;            // 圖像中只有二個顏色

    // 計算累計直方圖以及對應的帶權重的累計直方圖
    int[] S = new int[Last + 1];
    int[] W = new int[Last + 1];            // 對於特大圖，此數組的保存數據可能會超出int的表示范圍，可以考慮用long類型來代替
    S[0] = HistGram[0];
    for (Y = First > 1 ? First : 1; Y <= Last; Y++)
    {
        S[Y] = S[Y - 1] + HistGram[Y];
        W[Y] = W[Y - 1] + Y * HistGram[Y];
    }

    // 建立公式（4）及（6）所用的查找表
    double[] Smu = new double[Last + 1 - First];
    for (Y = 1; Y < Smu.Length; Y++)
    {
        double mu = 1 / (1 + (double)Y / (Last - First));               // 公式（4）
        Smu[Y] = -mu * Math.Log(mu) - (1 - mu) * Math.Log(1 - mu);      // 公式（6）
    }

    // 迭代計算最佳閾值
    for (Y = First; Y <= Last; Y++)
    {
        Entropy = 0;
        int mu = (int)Math.Round((double)W[Y] / S[Y]);             // 公式17
        for (X = First; X <= Y; X++)
            Entropy += Smu[Math.Abs(X - mu)] * HistGram[X];
        mu = (int)Math.Round((double)(W[Last] - W[Y]) / (S[Last] - S[Y]));  // 公式18
        for (X = Y + 1; X <= Last; X++)
            Entropy += Smu[Math.Abs(X - mu)] * HistGram[X];       // 公式8
        if (BestEntropy > Entropy)
        {
            BestEntropy = Entropy;      // 取最小熵處為最佳閾值
            Threshold = Y;
        }
    }
    return Threshold;
}

代碼其實還是很簡單的。

五、效果：

　針對一些圖像，我們做了如下測試：

　　　　　　　　　　　　原圖　　　　　　　　　　　　　　　　　　　　　　　　　　　　　　　　二值圖，閾值=175

上圖使用OSTU等經典算法都無法獲得上圖的理想效果。

　　　　　　　　　　　　原圖　　　　　　　　　　　　　　　　　　　　　　　　　　　　　　　　二值圖，閾值=67

上圖和其他一些二值算法的效果也是非常類似的。

*********************************作者： laviewpbt 時間： 2013.9.5 聯系QQ: 33184777 轉載請保留本行信息************************

免責聲明！

本站轉載的文章為個人學習借鑒使用，本站對版權不負任何法律責任。如果侵犯了您的隱私權益，請聯系本站郵箱yoyou2525@163.com刪除。

猜您在找 從GIMP的Retinex算法里發現了一種高斯模糊的快速實現方法【開發記錄】。 Python_OpenCV_實現模糊集合用於圖像增強（對比度提升，空間濾波）高品質后處理：十種圖像模糊算法的總結與實現 iOS 開發之模糊效果的五種實現模糊數學 1、模糊集、隸屬度函數、如何確定隸屬度函數自整定模糊PID算法的理論 Jwt通過Redis續期的一種實現原理 Python實現全排列的一種算法基於灰度世界、完美反射、動態閾值等圖像自動白平衡算法的原理、實現及效果圖像去模糊算法循序漸進附完整代碼