圖像的閾值化就是利用圖像像素點分布規律,設定閾值進行像素點分割,進而得到圖像的二值圖像。圖像閾值化操作有多種方法,常用方法有經典的OTSU、固定閾值、自適應閾值、雙閾值及半閾值化操作。這里對各種閾值化操作進行一個總結。
OTSU閾值化
在閾值化處理中,常用的算法就是OTSU。發明人是Nobuyuki Ostu。這種二值化操作閾值的選取非常重要,閾值選取的不合適,可能得到的結果就毫無用處。簡單的說,這種算法假設衣服圖像由前景色和背景色組成。通過統計學的方法來選取一個閾值,使這個閾值可以將前景色和背景色盡可能分開。
我們知道一幅灰度圖像,可以計算它的顏色平均值,或者更進一步,可以計算出灰度直方圖。我們可以把這幅圖的灰度平均值為M,任意選取一個灰度值t,則可以將這個直方圖分成前后兩部分。我們稱這兩部分分別為A和B,對應的就是前景色和背景色。這兩部分各自的平均值為$ M_0 \(和\) M_1 \(。A部分里的像素站總像素數的比例為\) p_0 \(,B部分里的像素數站總像素數的比例為\) p_1 $。Nobuyuki Ostu給出的類間方差定義為:
展開后如下:
又:
帶入(1)得如下:
其實現代碼如下:
#include "opencv2/core/core.hpp"
#include "opencv2/imgproc/imgproc.hpp"
#include "opencv2/highgui/highgui.hpp"
#include <iostream>
#include <string>
#include <cmath>
using namespace cv;
int Otsu(Mat matSrc)
{
if (CV_8UC1 != matSrc.type())
return -1;
int nCols = matSrc.cols;
int nRows = matSrc.rows;
int nPixelNum = nCols * nRows;
// 初始化
int pixelNum[256];
double probability[256];
for (int i = 0; i < 256; i++)
{
pixelNum[i] = 0;
probability[i] = 0.0;
}
// 統計像素數和頻率
for (int j = 0; j < nRows; j++)
{
for (int i = 0; i < nCols; i++)
{
pixelNum[matSrc.at<uchar>(j, i)]++;
}
}
for (int i = 0; i < 256; i++)
{
probability[i] = (double)0.1*pixelNum[i] / nPixelNum;
}
// 計算
int nThreshold = 0; // 最佳閾值
double dMaxDelta = 0.0; // 最大類間方差
double dMean_0 = 0.0; // 左邊平均值
double dMean_1 = 0.0; // 右邊平均值
double dDelta = 0.0; // 類間方差
double dMean_0_temp = 0.0; // 左邊平均值中間值
double dMean_1_temp = 0.0; // 右邊平均值中間值
double dProbability_0 = 0.0; // 左邊頻率值
double dProbability_1 = 0.0; // 右邊頻率值
for (int j = 0; j < 256; j++)
{
for (int i = 0; i < 256; i++)
{
if (i < j)// 前半部分
{
dProbability_0 += probability[i];
dMean_0_temp += i * probability[i];
}
else // 后半部分
{
dProbability_1 += probability[i];
dMean_1_temp += i * probability[i];
}
}
// 計算平均值
// fMean_0_teamp計算的是前半部分的灰度值的總和除以總像素數,
// 所以要除以前半部分的頻率才是前半部分的平均值,后半部分同樣
dMean_0 = dMean_0_temp / dProbability_0;
dMean_1 = dMean_1_temp / dProbability_1;
dDelta = (double)(dProbability_0 * dProbability_1 * pow((dMean_0 - dMean_1), 2));
if (dDelta > dMaxDelta)
{
dMaxDelta = dDelta;
nThreshold = j;
}
// 相關參數歸零
dProbability_0 = 0.0;
dProbability_1 = 0.0;
dMean_0_temp = 0.0;
dMean_1_temp = 0.0;
dMean_0 = 0.0;
dMean_1 = 0.0;
dDelta = 0.0;
}
return nThreshold;
}
測試代碼如下:
int main()
{
std::string strPath = "D:\\MyDocuments\\My Pictures\\OpenCV\\";
Mat matSrc = imread(strPath + "shrimp.jpg");
if (matSrc.empty())
return -1;
int nCols = matSrc.cols;
int nRows = matSrc.rows;
Mat matGray;
cvtColor(matSrc, matGray, CV_BGR2GRAY);
imshow("gray", matGray);
int nOstuThreshold = Otsu(matGray);
std::cout << nOstuThreshold << std::endl;
Mat matOstu = Mat::zeros(matGray.rows, matGray.cols, CV_8UC1);
// 用得到的值進行二值化處理
for (int j = 0; j < nRows; j++)
{
for (int i = 0; i < nCols; i++)
{
if (matGray.at<uchar>(j, i) < nOstuThreshold)
{
// matOstu.at<uchar>(j, i) = matGray.at<uchar>(j, i);
matOstu.at<uchar>(j, i) = matGray.at<uchar>(j, i);
}
else
{
// matOstu.at<uchar>(j, i) = matGray.at<uchar>(j, i);
matOstu.at<uchar>(j, i) = 0;
}
}
}
imshow("ostu", matOstu);
imwrite(strPath + "ostu.jpg", matOstu);
waitKey();
return 0;
}
原圖:

閾值處理后:

固定閾值化
OpenCV中提供了閾值化函數threshold,該函數有5中閾值化類型參數。簡單說就是用一個固定閾值來分割圖像。至於分割方式有多種。分別對應不同的閾值化方式。其函數原型如下:
double threshold(InputArray src, OutputArray dst, double thresh, double maxval, int type)
參數src表示原圖像數組(單通道,8位或32位浮點數據);dst表示輸出圖像組;thresh表示閾值大小;maxval表示預設最大值(THRESH_BINARY或THRESH_BINARY_INV時有用);type表示閾值化處理的類型設置。type的各種類型如下:
THRESH_BINARY二進制閾值化
將灰度值大於thresh的設置為maxval,不大於thresh設置為0。灰度計算式如下:
THRESH_BINARY_INV反二進制閾值化
將灰度值大於thresh的設置為0,不大於thresh設置為maxval。灰度計算式如下:
THRESH_TRUNC截斷閾值化
將灰度值大於thresh的設置為threshold,不大於thresh的灰度值不變。灰度計算式如下:
THRESH_TOZERO閾值化為0
將灰度值大於thresh的不變,不大於thresh的灰度值設置為0。灰度計算式如下:
THRESH_TOZERO_INV反閾值化為0
將灰度值大於thresh的不變,不大於thresh的灰度值設置為0。灰度計算式如下:
試例代碼如下:
#include "opencv2/core/core.hpp"
#include "opencv2/imgproc/imgproc.hpp"
#include "opencv2/highgui/highgui.hpp"
#include <iostream>
#include <string>
#include <cmath>
using namespace cv;
int main()
{
std::string strPath = "D:\\MyDocuments\\My Pictures\\OpenCV\\";
Mat matSrc = imread(strPath + "shrimp.jpg");
Mat matGray, matThresh;
cvtColor(matSrc, matGray, CV_BGR2GRAY);
threshold(matGray, matThresh, 156, 255, CV_THRESH_TOZERO_INV);
imshow("gray", matGray);
imshow("thresh", matThresh);
imwrite(strPath + "thresh.jpg", matThresh);
waitKey();
return 0;
}
原圖:

閾值處理后的圖:

自適應閾值化
在圖像閾值化操作中,我們更關心的是從二值化圖像中分離目標區域和背景區域,僅僅通過固定閾值很難達到理想的分割效果。在圖片中的灰度是不均勻的,所以通常情況下圖片中不同區域的閾值時不一樣的。在不同局部選取閾值的方法有多種。在OpenCV中實現了兩種方法:1)局部鄰域塊的均值;2)局部鄰域塊的高斯加權和。其函數原型如下:
void adaptiveThreshold(InoutArray src, OutputArray dst, double maxValue, int adaptiveMethod, int thresholdType, int blockSize, double C)
src表示源圖像數組;
dst表示輸出圖像組;
maxValue表示預設滿足條件最大值;
adaptiveMethod表示自適應閾值算法選擇ADAPTIVE_THRESH_MEAN_C或ADAPTIVE_THRESH_GAUSSIAN_C;
ADAPTIVE_THRESH_MEAN_C的計算方法是計算出鄰域的平均值再減去第七個參數double C的值
ADAPTIVE_THRESH_GAUSSIAN_C的計算方法是計算出鄰域的高斯均勻值再減去第七個參數double C的值
thresholdType表示閾值類型THRESH_BINARY或THRESH_BINARY_INV;
blockSize表示鄰域塊大小,用來計算區域閾值,一般選擇3、5、7......;
參數C表示常數,它是一個從均勻或加權均值提取的常數,可以是負數。
試例代碼如下:
#include "opencv2/core/core.hpp"
#include "opencv2/imgproc/imgproc.hpp"
#include "opencv2/highgui/highgui.hpp"
#include <iostream>
#include <string>
#include <cmath>
using namespace cv;
int main_adaptive()
{
std::string strPath = "D:\\MyDocuments\\My Pictures\\OpenCV\\";
Mat matSrc = imread(strPath + "panda.jpg");
Mat matGray, matAdaptive;
cvtColor(matSrc, matGray, CV_BGR2GRAY);
// adaptiveThreshold(matGray, matAdaptive, 255, ADAPTIVE_THRESH_MEAN_C, THRESH_BINARY_INV, 5, 5);
adaptiveThreshold(matGray, matAdaptive, 255, ADAPTIVE_THRESH_GAUSSIAN_C, THRESH_BINARY_INV, 5, 5);
imshow("gray", matGray);
imshow("adaptive", matAdaptive);
imwrite(strPath + "adaptive.jpg", matAdaptive);
waitKey();
return 0;
}
原圖:
閾值處理后的圖:
