二值圖像連通域標記

本文轉載自查看原文 2015-06-01 15:47 9717 圖像處理

來源：http://www.cnblogs.com/ronny/p/img_aly_01.html

一、前言

二值圖像，顧名思義就是圖像的亮度值只有兩個狀態：黑(0)和白(255)。二值圖像在圖像分析與識別中有着舉足輕重的地位，因為其模式簡單，對像素在空間上的關系有着極強的表現力。在實際應用中，很多圖像的分析最終都轉換為二值圖像的分析，比如：醫學圖像分析、前景檢測、字符識別，形狀識別。二值化+數學形態學能解決很多計算機識別工程中目標提取的問題。

二值圖像分析最重要的方法就是連通區域標記，它是所有二值圖像分析的基礎，它通過對二值圖像中白色像素（目標）的標記，讓每個單獨的連通區域形成一個被標識的塊，進一步的我們就可以獲取這些塊的輪廓、外接矩形、質心、不變矩等幾何參數。

下面是一個二值圖像被標記后，比較形象的顯示效果，這就是我們這篇文章的目標。

二、連通域

在我們討論連通區域標記的算法之前，我們先要明確什么是連通區域，怎樣的像素鄰接關系構成連通。在圖像中，最小的單位是像素，每個像素周圍有8個鄰接像素，常見的鄰接關系有2種：4鄰接與8鄰接。4鄰接一共4個點，即上下左右，如下左圖所示。8鄰接的點一共有8個，包括了對角線位置的點，如下右圖所示。

如果像素點A與B鄰接，我們稱A與B連通，於是我們不加證明的有如下的結論：

如果A與B連通，B與C連通，則A與C連通。

在視覺上看來，彼此連通的點形成了一個區域，而不連通的點形成了不同的區域。這樣的一個所有的點彼此連通點構成的集合，我們稱為一個連通區域。

下面這符圖中，如果考慮4鄰接，則有3個連通區域；如果考慮8鄰接，則有2個連通區域。（注：圖像是被放大的效果，圖像正方形實際只有4個像素）。

三、連通區域的標記

連通區域標記算法有很多種，有的算法可以一次遍歷圖像完成標記，有的則需要2次或更多次遍歷圖像。這也就造成了不同的算法時間效率的差別，在這里我們介紹2種算法。

第一種算法是現在matlab中連通區域標記函數bwlabel中使的算法，它一次遍歷圖像，並記下每一行（或列）中連續的團（run）和標記的等價對，然后通過等價對對原來的圖像進行重新標記，這個算法是目前我嘗試的幾個中效率最高的一個，但是算法里用到了稀疏矩陣與Dulmage-Mendelsohn分解算法用來消除等價對，這部分原理比較麻煩，所以本文里將不介紹這個分解算法，取而代這的用圖的深度優先遍歷來替換等價對。

第二種算法是現在開源庫cvBlob中使用的標記算法，它通過定位連通區域的內外輪廓來標記整個圖像，這個算法的核心是輪廓的搜索算法，這個我們將在文章中詳細介紹。這個算法相比與第一種方法效率上要低一些，但是在連通區域個數在100以內時，兩者幾乎無差別，當連通區域個數到了

四、基於行程的標記

我們首先給出算法的描述，然后再結合實際圖像來說明算法的步驟。

1，逐行掃描圖像，我們把每一行中連續的白色像素組成一個序列稱為一個團(run)，並記下它的起點start、它的終點end以及它所在的行號。

2，對於除了第一行外的所有行里的團，如果它與前一行中的所有團都沒有重合區域，則給它一個新的標號；如果它僅與上一行中一個團有重合區域，則將上一行的那個團的標號賦給它；如果它與上一行的2個以上的團有重疊區域，則給當前團賦一個相連團的最小標號，並將上一行的這幾個團的標記寫入等價對，說明它們屬於一類。

3，將等價對轉換為等價序列，每一個序列需要給一相同的標號，因為它們都是等價的。從1開始，給每個等價序列一個標號。

4，遍歷開始團的標記，查找等價序列，給予它們新的標記。

5，將每個團的標號填入標記圖像中。

6，結束。

我們來結合一個三行的圖像說明，上面的這些操作。

第一行，我們得到兩個團：[2,6]和[10,13]，同時給它們標記1和2。

第二行，我們又得到兩個團：[6,7]和[9,10]，但是它們都和上一行的團有重疊區域，所以用上一行的團標記，即1和2。

第三行，兩個：[2,4]和[7,8]。[2,4]這個團與上一行沒有重疊的團，所以給它一個新的記號為3；而[2,4]這個團與上一行的兩個團都有重疊，所以給它一個兩者中最小的標號，即1，然后將（1，2）寫入等價對。

全部圖像遍歷結束，我們得到了很多個團的起始坐標，終止坐標，它們所在的行以及它們的標號。同時我們還得到了一個等價對的列表。

下面我們用C++實現上面的過程，即步驟2，分兩個進行：

1）fillRunVectors函數完成所有團的查找與記錄；

 1 void fillRunVectors(const Mat& bwImage, int& NumberOfRuns, vector<int>& stRun, vector<int>& enRun, vector<int>& rowRun)
 2 {
 3     for (int i = 0; i < bwImage.rows; i++)
 4     {
 5         const uchar* rowData = bwImage.ptr<uchar>(i);
 6 
 7         if (rowData[0] == 255)
 8         {
 9             NumberOfRuns++;
10             stRun.push_back(0);
11             rowRun.push_back(i);
12         }
13         for (int j = 1; j < bwImage.cols; j++)
14         {
15             if (rowData[j - 1] == 0 && rowData[j] == 255)
16             {
17                 NumberOfRuns++;
18                 stRun.push_back(j);
19                 rowRun.push_back(i);
20             }
21             else if (rowData[j - 1] == 255 && rowData[j] == 0)
22             {
23                 enRun.push_back(j - 1);
24             }
25         }
26         if (rowData[bwImage.cols - 1])
27         {
28             enRun.push_back(bwImage.cols - 1);
29         }
30     }
31 }

2）firstPass函數完成團的標記與等價對列表的生成。相比之下第二個函數要稍微難理解一些。

(如果兩個Runs中隔了一行，有可能還可以標為等價對。要在firstpass中加多一個判斷兩個Runs是否行是相鄰的才可以)

 1 void firstPass(vector<int>& stRun, vector<int>& enRun, vector<int>& rowRun, int NumberOfRuns,
 2     vector<int>& runLabels, vector<pair<int, int>>& equivalences, int offset)
 3 {
 4     runLabels.assign(NumberOfRuns, 0);
 5     int idxLabel = 1;
 6     int curRowIdx = 0;
 7     int firstRunOnCur = 0;
 8     int firstRunOnPre = 0;
 9     int lastRunOnPre = -1;
10     for (int i = 0; i < NumberOfRuns; i++)
11     {
12         if (rowRun[i] != curRowIdx)
13         {
14             curRowIdx = rowRun[i];
15             firstRunOnPre = firstRunOnCur;
16             lastRunOnPre = i - 1;
17             firstRunOnCur = i;
18 
19         }
20         for (int j = firstRunOnPre; j <= lastRunOnPre; j++)
21         {
22             if (stRun[i] <= enRun[j] + offset && enRun[i] >= stRun[j] - offset)
23             {
24                 if (runLabels[i] == 0) // 沒有被標號過
25                     runLabels[i] = runLabels[j];
26                 else if (runLabels[i] != runLabels[j])// 已經被標號             
27                     equivalences.push_back(make_pair(runLabels[i], runLabels[j])); // 保存等價對
28             }
29         }
30         if (runLabels[i] == 0) // 沒有與前一列的任何run重合
31         {
32             runLabels[i] = idxLabel++;
33         }
34 
35     }
36 }

接下來是我們的重點，即等價對的處理，我們需要將它轉化為若干個等價序列。比如有如下等價對：

(1,2),(1,6),(3,7),(9-3),(8,1),(8,10),(11,5),(11,8),(11,12),(11,13),(11,14),(15,11)

我們需要得到最終序列是：

一個思路是將1-15個點都看成圖的結點，而等價對（1，2）說明結點1與結點2之間有通路，而且形成的圖是無向圖，即（1，2）其實包含了（2，1）。我們需要遍歷圖，找出其中的所有連通圖。所以我們采用了圖像深入優先遍歷的原理，進行等價序列的查找。

從結點1開始，它有3個路徑1-2，1-6，1-8。2和6后面都沒有路徑，8有2條路徑通往10和11，而10沒有后續路徑，11則有5條路徑通往5，12，13，14，15。等價表1查找完畢。

第2條等價表從3開始，則只有2條路徑通向7和9，7和9后面無路徑，等價表2查找完畢。

最后只剩下4，它沒有在等價對里出現過，所以單兒形成一個序列（這里假設步驟2中團的最大標號為15）。

下面是這個過程的C++實現，每個等價表用一個vector<int>來保存，等價對列表保存在map<pair<int,int>>里。

 1 void replaceSameLabel(vector<int>& runLabels, vector<pair<int, int>>&
 2     equivalence)
 3 {
 4     int maxLabel = *max_element(runLabels.begin(), runLabels.end());
 5     vector<vector<bool>> eqTab(maxLabel, vector<bool>(maxLabel, false));
 6     vector<pair<int, int>>::iterator vecPairIt = equivalence.begin();
 7     while (vecPairIt != equivalence.end())
 8     {
 9         eqTab[vecPairIt->first - 1][vecPairIt->second - 1] = true;
10         eqTab[vecPairIt->second - 1][vecPairIt->first - 1] = true;
11         vecPairIt++;
12     }
13     vector<int> labelFlag(maxLabel, 0);
14     vector<vector<int>> equaList;
15     vector<int> tempList;
16     cout << maxLabel << endl;
17     for (int i = 1; i <= maxLabel; i++)
18     {
19         if (labelFlag[i - 1])
20         {
21             continue;
22         }
23         labelFlag[i - 1] = equaList.size() + 1;
24         tempList.push_back(i);
25         for (vector<int>::size_type j = 0; j < tempList.size(); j++)
26         {
27             for (vector<bool>::size_type k = 0; k != eqTab[tempList[j] - 1].size(); k++)
28             {
29                 if (eqTab[tempList[j] - 1][k] && !labelFlag[k])
30                 {
31                     tempList.push_back(k + 1);
32                     labelFlag[k] = equaList.size() + 1;
33                 }
34             }
35         }
36         equaList.push_back(tempList);
37         tempList.clear();
38     }
39     cout << equaList.size() << endl;
40     for (vector<int>::size_type i = 0; i != runLabels.size(); i++)
41     {
42         runLabels[i] = labelFlag[runLabels[i] - 1];
43     }
44 }

五、基於輪廓的標記

在這里我還是先給出算法描述：

1，從上至下，從左至右依次遍歷圖像。

2，如下圖A所示，A為遇到一個外輪廓點（其實上遍歷過程中第一個遇到的白點即為外輪廓點），且沒有被標記過，則給A一個新的標記號。我們從A點出發，按照一定的規則（這個規則后面詳細介紹）將A所在的外輪廓點全部跟蹤到，然后回到A點，並將路徑上的點全部標記為A的標號。

3，如下圖B所示，如果遇到已經標記過的外輪廓點

4，如下圖C所示，如果遇到了一個已經被標記的點B，且是內輪廓的點(它的正下方像素為黑色像素且不在外輪廓上)，則從B點開始，跟蹤內輪廓，路徑上的點都設置為B的標號，因為B已經被標記過與A相同，所以內輪廓與外輪廓將標記相同的標號。

5，如下圖D所示，如果遍歷到內輪廓上的點，則也是用輪廓的標號去標記它右側的點，直到遇到黑色像素為止。

6，結束。

整個算法步驟，我們只掃描了一次圖像，同時我們對圖像中的像素進行標記，要么賦予一個新的標號，要么用它同行的左邊的標號去標記它，下面是算法更詳細的描述：

對於一個需要標記的圖像

情況1：如果

情況2：如果P點的下方的點是unmarked點（什么是unmark點，情況3介紹完就會給出定義），則P點一定是內輪廓上的點，這時候有兩種情況，一種是P點在L上已經被標記過了，說明這個點同時也是外輪廓上的點；另一種情況是P點在L上還沒有被標記過，那如果是按上面步驟來的，P點左邊的點一定被標記了（這一處剛開始理解可能不容易，不妨畫一個簡單的圖，自己試着一個點一個點標記試試，就容易理解了），所以這時候我們采用P點左邊點的標記值來標記P，接着從P點開始跟蹤內輪廓把內輪廓上的點都標記為P的標號。

下面圖像顯示了上面分析的兩種P的情況，左圖的P點既是外輪廓上的點也是內輪廓上的點。

情況3：如果一個點P，不是上面兩種情況之一，那么P點的左邊一定被標記過(不理解，就手動去標記上面兩幅圖像)，我們只需要用它左邊的標號去標記L上的P點。

現在我們只剩下一個問題了，就是什么是unmarked點，我們知道內輪廓點開始點P的下方一定是一個黑色像素，是不是黑色像素就是unmarked點呢，顯然不是，如下圖像的Q點，它的下面也是黑色像素，然而它卻不是內輪廓上的點。

實際上在我們在輪廓跟蹤時，我們我輪廓點的周圍做了標記，在輪廓點周圍被查找過的點（查找方式見下面的輪廓跟蹤算法）在L上被標記了一個負值（如下面右圖所示），所以Q點的下方被標記為了負值，這樣Q的下方就不是一個unmarked點，unmarked點，即在L上的標號沒有被修改過，即為0。

顯然，這個算法的重點在於輪廓的查找與標記，而對於輪廓的查找，就是確定搜索策略的問題，我們下面給內輪廓與外輪廓定義tracker規則。

我們對一點像素點周圍的8個點分析作一個標號0-7，因為我們在遍歷圖像中第一個遇到的點肯定是外輪廓點，所以我們先來確定外輪廓的搜索策略，對於外輪廓的點P，有兩種情況：

1）如果P是外輪廓的起點，也就是說我們是從P點開始跟蹤的，那么我們從7號（右上角）位置

2）那么如果P是不是外輪廓的起點，即P是外輪廓路徑上的一個點，那么它肯定是由一個點進入的，我們設置為

外輪廓點的跟蹤方式確定了后，內輪廓點的跟蹤方式大同小異，只是如果P是內輪廓的第一個點，則它的開始搜索位置不是7號點而是3號點。其他的與外輪廓完全一致。

如要上面搜索方式，你不是很直觀的理解，不妨嘗試着去搜索下面這幅圖像，你應該有能有明確的了解了。一個路徑搜索結束的條件是，回到原始點S，則S周圍不存在unmarked點。

如下邊中間圖像所示，從S點開始形成的路徑是STUTSVWV。

在OpenCV中查找輪廓的函數已經存在了，而且可以得到輪廓之間的層次關系。這個函數按上面的算法實現起來並不困難，所以這里就不再實現這個函數，有興趣的可以看OpenCV的源碼（contours.cpp）。

 1 void bwLabel(const Mat& imgBw, Mat & imgLabeled)
 2 {
 3     // 對圖像周圍擴充一格
 4     Mat imgClone = Mat(imgBw.rows + 1, imgBw.cols + 1, imgBw.type(), Scalar(0));
 5     imgBw.copyTo(imgClone(Rect(1, 1, imgBw.cols, imgBw.rows)));
 6 
 7     imgLabeled.create(imgClone.size(), imgClone.type());
 8     imgLabeled.setTo(Scalar::all(0));
 9 
10     vector<vector<Point>> contours;
11     vector<Vec4i> hierarchy;
12     findContours(imgClone, contours, hierarchy, CV_RETR_CCOMP, CV_CHAIN_APPROX_NONE);
13 
14     vector<int> contoursLabel(contours.size(), 0);
15     int numlab = 1;
16     // 標記外圍輪廓
17     for (vector<vector<Point>>::size_type i = 0; i < contours.size(); i++)
18     {
19         if (hierarchy[i][3] >= 0) // 有父輪廓
20         {
21             continue;
22         }
23         for (vector<Point>::size_type k = 0; k != contours[i].size(); k++)
24         {
25             imgLabeled.at<uchar>(contours[i][k].y, contours[i][k].x) = numlab;
26         }
27         contoursLabel[i] = numlab++;
28     }
29     // 標記內輪廓
30     for (vector<vector<Point>>::size_type i = 0; i < contours.size(); i++)
31     {
32         if (hierarchy[i][3] < 0)
33         {
34             continue;
35         }
36         for (vector<Point>::size_type k = 0; k != contours[i].size(); k++)
37         {
38             imgLabeled.at<uchar>(contours[i][k].y, contours[i][k].x) = contoursLabel[hierarchy[i][3]];
39         }
40     }
41     // 非輪廓像素的標記
42     for (int i = 0; i < imgLabeled.rows; i++)
43     {
44         for (int j = 0; j < imgLabeled.cols; j++)
45         {
46             if (imgClone.at<uchar>(i, j) != 0 && imgLabeled.at<uchar>(i, j) == 0)
47             {
48                 imgLabeled.at<uchar>(i, j) = imgLabeled.at<uchar>(i, j - 1);
49             }
50         }
51     }
52     imgLabeled = imgLabeled(Rect(1, 1, imgBw.cols, imgBw.rows)).clone(); // 將邊界裁剪掉1像素
53 }

免責聲明！

本站轉載的文章為個人學習借鑒使用，本站對版權不負任何法律責任。如果侵犯了您的隱私權益，請聯系本站郵箱yoyou2525@163.com刪除。

猜您在找 圖像分析：二值圖像連通域標記實現基於C語言的二值圖像連通域標記算法二值圖像求取連通域算法二值圖像連通區域標記關於Two-Pass標記連通域個數二值圖像連通分量的提取（python+opencv) 求矩陣連通域的個數二值圖像的幾何性質 opencv學習系列：連通域參考處理手寫01矩陣連通域分析