總結學習下圖像處理方面基礎知識。
這是第一篇,簡單的介紹下使用OpenCV的三個基本功能:
- 圖像的讀取
- 圖像的顯示
- 訪問圖像的像素值
然后概述下圖像噪聲的類型,並為圖像添加兩種常見的噪聲:高斯噪聲和椒鹽噪聲。
最后,使用中值濾波和均值濾波來處理帶有噪聲的圖像。
OpenCV基礎
在OpenCV中,完成圖像的輸入輸出以及顯示,只需要以下幾個函數:
namedWindow
創建一個可以通過其名字引用的窗口。第一個參數,設置窗口的name,可以通過name引用該窗口;第二個參數,設置窗口的大小。有以下幾個選擇:
- WINDOW_NORMAL or WINDOW_AUTOSIZE 調整窗口的大小以適應圖像,不同的是,使用WINDOW_NORMAL可以手動調整窗口的大小;WINDOW_AUTOSIZE不能調整窗口的大小。
- WINDOW_FREERATIO or WINDOW_KEEPRATIO 改變窗口時是否會保持圖像的ratio不變,沒發現這倆有什么區別。
imshow
顯示圖像
imread
讀取圖像數據到Mat
中,第一個參數是圖像的文件名;第二個參數是標志,標識怎么處理圖像的色彩。常用的幾個選項:
- IMREAD_UNCHANGED 和原圖像保持一直不變
- IMREAD_GRAYSCALE 將圖像轉換為單通道的灰度圖
- IMREAD_COLOR 將圖像轉換為3通道的BGR,默認選項
- IMREAD_REDUCED_GRAYSCALE_2 IMREAD_REDUCED_GRAYSCALE_4 IMREAD_REDUCED_GRAYSCALE_8 單通道灰度圖讀入圖像,並減小圖像的大小。減小的值為1/2,1/4,1/8
- IMREAD_REDUCED_COLOR_2 IMREAD_REDUCED_COLOR_4 IMREAD_REDUCED_COLOR_2 3通道BGR讀入圖像,並減小圖像的大小。減小的值為1/2,1/4,1/8
Mat
是OpenCV中最重要的數據結構,在做圖像處理時基本都是對該結構體的操作。Mat
由兩部分構成:矩陣頭和矩陣數據,矩陣頭較小,創建的每個Mat
實例都擁有一個矩陣頭,而矩陣數據通常占有較大的空間,OpenCV中通過引用計數來管理這部分內存空間,當調用賦值運算符和拷貝構造函數時,並不會只復制矩陣頭,並不會復制矩陣數據,只是將其的引用計數加1.例如:
Mat m = imread("img.jpg");
Mat a = m; // 賦值運算符
Mat b(m); // 拷貝構造函數
上面代碼中的a
,b
和m
各自擁有自己的矩陣頭,其引用的數據卻指向同一份。也就是說,修改了其中任意一個,都會影響到其余的兩個。
要想復制矩陣數據,可以調用clone
和copyTo
這兩個函數
Mat m = imread("img.jpg");
Mat f = m.clone();
Mat g ;
m.copyTo(g);
將圖像讀入到Mat
后,有三種方式訪問Mat
中的數據:
- 通過指針
- 使用迭代器
- 調用at
圖像噪聲
圖像噪聲是圖像在獲取或傳輸的過程中受到隨機信號的干擾,在圖像上出現的一些隨機的、離散的、孤立的像素點,這些點會干擾人眼對圖像信息的分析。圖像的噪聲通常是比較復雜的,很多時候將其看成是多維隨機過程,因而可以借助於隨即過程描述噪聲,即使用概率分布函數和概率密度函數。
圖像的噪聲很多,性質也千差萬別, 可以通過不同的方法給噪聲分類。
按照產生的原因:
- 外部噪聲
- 內部噪聲
這種分類方法,有助於理解噪聲產生的源頭,但對於降噪算法只能起到原理上的幫組。
噪聲和圖像信號的關系,可以分為:
- 加性噪聲,加性噪聲和圖像信號強度不相關,這類噪聲可以看着理想無噪聲圖像f和噪聲的和。
- 乘性噪聲,乘性噪聲和圖像信號是相關的,往往隨圖像信號的變化而變化。
而為了分析處理的方便,常常將乘性噪聲近似認為是加性噪聲,而且總是假定信號和噪聲是互相獨立的。
最重要的來了,按照概率密度函數(PDF)分類:
- 高斯噪聲,高斯噪聲模型經常被用於實踐中。
- 脈沖噪聲(椒鹽噪聲),圖像上一個個點,也可稱為散粒和尖峰噪聲。
- 伽馬噪聲
- 瑞利噪聲
- 指數分布噪聲
- 均勻分布噪聲
這種分類方法,引入了數學模型,對設計過濾算法比較有幫助。
給圖像添加噪聲
按照指定的噪聲類型,生成一個隨機數,然后將這個隨機數加到源像素值上,並將得到的值所放到[0,255]區間即可。
C++11 隨機數發生器
新的隨機數生成器被抽象成了兩個部分:隨機數生成引擎和要生成的隨機數符合的分布。
隨機數引擎有三種:
- linear_congruential_engine 線性同余算法
- mersenne_twister_engine 梅森旋轉算法
- subtract_with_carry_engine 帶進位的線性同余算法
第一種最常用,而且速度比較快;第二種號稱最好的偽隨機數生成器
#include <random>
std::random_device rd; // 隨機數種子
std::mt19937 mt(rd()); // 隨機數引擎
std::normal_distribution<> d(5,20); // 高斯分布
std::map<int,int> hist;
for(int n = 0; n < 10000; n ++)
++hist[std::round(d(mt))]; // 生成符合高斯分布的隨機數
添加圖像噪聲
使用C++的隨機數發生器為圖像添加兩種噪聲:椒鹽噪聲和高斯噪聲。
椒鹽噪聲是圖像中離散分布的白點或者黑點,其代碼如下:
// 添加椒鹽噪聲
void addSaltNoise(Mat &m, int num)
{
// 隨機數產生器
std::random_device rd; //種子
std::mt19937 gen(rd()); // 隨機數引擎
auto cols = m.cols * m.channels();
for (int i = 0; i < num; i++)
{
auto row = static_cast<int>(gen() % m.rows);
auto col = static_cast<int>(gen() % cols);
auto p = m.ptr<uchar>(row);
p[col++] = 255;
p[col++] = 255;
p[col] = 255;
}
}
上述代碼中使用ptr<uchar>()
獲取圖像某一行的行首指針,得到行首指針后就可以任意的訪問改行的像素值。
高斯噪聲是一種加性噪聲,為圖像添加高斯噪聲的代碼如下:
// 添加Gussia噪聲
// 使用指針訪問
void addGaussianNoise(Mat &m, int mu, int sigma)
{
// 產生高斯分布隨機數發生器
std::random_device rd;
std::mt19937 gen(rd());
std::normal_distribution<> d(mu, sigma);
auto rows = m.rows; // 行數
auto cols = m.cols * m.channels(); // 列數
for (int i = 0; i < rows; i++)
{
auto p = m.ptr<uchar>(i); // 取得行首指針
for (int j = 0; j < cols; j++)
{
auto tmp = p[j] + d(gen);
tmp = tmp > 255 ? 255 : tmp;
tmp = tmp < 0 ? 0 : tmp;
p[j] = tmp;
}
}
}
隨機產生符合高斯分布的隨機數,然后將該值和圖像原有的像素值相加,並將得到的和壓縮到[0,255]區間內。
左邊是原圖,中間的是添加高斯噪聲后的圖像,最右邊的是添加椒鹽噪聲后的圖像。
使用濾波器去除噪聲
根據噪聲類型的不同,選擇不同的濾波器過濾掉噪聲。通常,對於椒鹽噪聲,選擇中值濾波器(Median Filter),在去掉噪聲的同時,不會模糊圖像;對於高斯噪聲,選擇均值濾波器(Mean Filter),能夠去掉噪聲,但會對圖像造成一定的模糊。
在OpenCV中,對應於均值濾波器的函數是blur
,該函數需要5個參數,通常只設置前3個后兩個使用默認值即可。
blur(m, m2, Size(5, 5));
第一個參數是輸入的圖像,第二個參數是輸出的圖像,第三個參數是濾波器的大小,這里使用的是\(5 \times 5\)的矩形。
對應於中值濾波器的函數是medianBlur(m1, m3, 5);
前兩個參數是輸入輸出的圖像,第三個參數是濾波器的大小,由於是選取的是中值,濾波器的大小通常是一個奇數。
下圖是對有噪聲圖像使用濾波器后的結果,中間的是原始圖像,左邊的是使用均值濾波器過濾高斯噪聲后的結果;右邊的是使用中值濾波器過濾椒鹽噪聲后的結果。可以明顯的看出,這兩種濾波器都能夠很好的去掉圖像的噪聲,但會對圖像造成一定的模糊,尤其是均值濾波器造成的模糊比較明顯。
總結
本文算是第一篇文章,簡單的介紹下OpenCV的基本使用;接着訪問圖像中的像素,並借助於C++11的隨機數庫,為圖像添加高斯噪聲和椒鹽噪聲;最后使用中值濾波器和均值濾波器除去圖像,並對結果進行了對比。
以后堅持每日對圖像處理的一些知識進行整理。