目錄
- 圖像及其數字化表示
- 數字圖像處理
- 圖像質量的評價
一、圖像及其數字化表示
1.1 人類對光本性認識
- 光微粒子:牛頓 -> 幾何光學 -> 直線傳播 --能解釋的現象:反射、折射、透射
- 光波:惠更斯等 -> 波動光學 -> 波長、頻率 --能解釋的現象:干涉、衍射
- 光(量)子:愛因斯坦、普朗克 -> 量子光學 -> 能量量子化(不連續) --能解釋的現象:光電效應、康普頓散射
1.2 圖像的顏色
常用的顏色模型
- RGB(紅、綠、藍)-> 主動產生顏色光源(顯示器)
- CMYK(青、品紅、黃、黑) (Cyan, Magenta, Yellow, Black) -> 用於印刷、繪畫等
- HSI(色調、色飽和度、亮度) (Hue, Saturation, Intensity) ->用於調整顏色分量
1.2.1 R、G、B 三基色
人眼的感受光譜范圍約為380~780 nm,原則上可采用各種不同的三色組為標准化,1931年國際照明委員會(CIE)作了統一規定,選定波長700nm、546.1nm和435.8nm的單色光作為紅、綠、藍三原色,又稱為物理三基色。任意彩色的顏色方程為:
利用RGB可產生大量的顏色,例如:RGB灰度級分別為256時,可產生224 ≈ 16.8 M 種顏色
顏色空間:描述顏色的三維空間坐標, 一個顏色定義為顏色空間的一個點
RGB顏色模型是三維直角坐標顏色系統中的一個單位正方體,在正方體的主對角線上,各原色的量相等,產生由暗到亮的白色,即灰度。(0,0,0)為黑,(1,1,1)為白,正方體的其他6個角點分別為紅、黃、綠、青、藍和品紅
1.2.2 顏色模型—CMY模型
CMY為相減混色,它與相加混色的RGB空間正好互補,也即用白色減去RGB空間中的某一色彩值就等於同樣色彩在CMY空間中的值
由於彩色墨水和顏料的化學特性,用等量的CMY三基色得到的黑色不是真正的黑色,因此在印刷術中常加一種真正的黑色,所以CMY又寫成CMYK
1.2.3 顏色模型—HSI 模型
從人的視覺系統出發,用色調(Hue)、色飽和度( Saturation或Chroma)和亮度(Intensity 或Brightness)來描述色彩
它比RGB色彩空間更符合人的視覺特性
- H、S、I 可以分開處理而且相互獨立
- 在HSI色彩空間可以大大簡化圖像分析和處理的工作量
- HSI色彩空間和RGB色彩空間只是同一物理量的不同表示法,因而它們之間存在着轉換關系
- 在圖像處理和計算機視覺中大量算法都可在HSI色彩空間中方便地使用
I:表示光照強度或稱為亮度,它確定了像素的整體亮度,而不管其顏色是什么。其最亮值為1,0為最暗。
H:表示色調,由角度表示(0~360º)。反映了該顏色最接近什么樣的光譜波長。0º為紅色,120º為綠色,240º為藍色。
S:表示色飽和度,色飽和度參數是色環的原點到彩色點的半徑長度。在環的外圍圓周是純的或稱飽和的顏色,其飽和度值為1。在中心是中性(灰)影調,即飽和度為0
1.2.4 顏色模型轉換
1.3 圖像表示
- 物理圖像—可用連續函數進行較好地描述、分析與處理
- 數字圖像—時空與幅度均為離散的數據矩陣
圖像的采樣與量化
- "分辨率:在一定的面積內取多少個點,或者多少個像素;
- "數據深度":記錄每個點的某一因素(亮度/色度)的數據位數。
采樣點數越多,圖像質量越好。當采樣點數減少時,圖上的塊狀效應就逐漸明顯。當圖像的采樣點數一定時,量化級數越多,圖像質量越好。量化級數最小的極端情況就是二值圖像,圖像出現假輪廓。
不同量化級別對圖像質量的影響。顯然,無論從平面的取點還是記錄數據的深度來講,采樣形成的圖像與母本必然有一定的差距,丟掉了一些數據。但這個差距如果控制得相當的小,那么這個差距就是可以接受的。
傳統圖像的描述方式與數據結構
矩陣(matrices)---黑白、灰度、彩色、…… /鏈表(chains)/拓撲結構(Topological data structures)/ 關系結構(Relational structures) ……
矩陣—黑白圖像(二值圖像): 指圖像的每個像素只能是黑或者白,沒有中間的過渡,故又稱為二值圖像。2值圖像的像素值為0、1。
矩陣—灰度圖像:灰度圖像像素的灰度級通常為8Bits,即0~255。"0"表示 純黑色,"255"表示純白色。現實圖像的類型基本上可表示為灰度圖像,其像素灰度級常用的為8 Bits,但向着10 Bits、12 Bits、16 Bits發展。
矩陣—灰度圖像:
矩陣—彩色圖像: 通常彩色圖像是指每個像素的信息由RGB三原色構成的圖像,其中RGB是由不同的灰度級來描述的。
圖片格式:https://www.jianshu.com/p/f6bde0058c94
1.4 顏色模型的應用-利用HSI模型特性消除紅眼
"紅眼"—閃光燈照相的結果:在HSI空間可定義紅眼為: -π/4 < 色調<π/4 色飽和度 > 0.3
處理算法
- 在臉部的特定區域進行色空間轉換RGB -> HSI
- 測試每一點像素
- 如果:-π/4 < H <π/4 and S>0.3
- 則該像素為紅眼像素,使其成為灰色:S=0
二、數字圖像處理
對數字圖像處理的定義:
對一個物體的數字表示—二維矩陣—施加一系列的操作,以得到所期望的結果。,常借助於連續函數的分析結果與處理方法進行離散處理,"數字圖像處理"不是指"處理數字圖像",而是指"圖像的數字處理"
數字圖像處理方式:
- 將一幅圖像變為另一幅經過加工的圖像,圖像 到圖像的過程
- 將一幅圖像轉化為一種非圖像的表示,分析、識別與理解的過程
數字圖像處理研究的內容
圖像變換:改變圖像的空間或頻譜分布,獲取或突出感興趣信息
- 空域變換:放大、縮小、旋轉……
- 頻域變換:傅立葉變換、離散余弦變換、Walsh變換 小波變換……
圖像增強和復原
- 提高圖像質量(去除噪聲、提高圖像的清晰度)
- 灰度修正、圖像平滑、幾何校正、圖像銳化……
圖像的理解和識別
- 從圖像中提取抽象化的特定信息
- 統計模式分類、句法模式分類……
連續與離散
- 模擬圖像:空間位置的連續性;每個位置上的光強度變化連續性
-
數字圖像:采樣(Sample):空間離散化,采樣(Sample):空間離散化
圖像采樣需解決的首要問題:從采樣點精確恢復原圖像所需要的最小的采樣點個數,即各采樣點在水平和垂直方向的最大間隔。該問題可看作一維采樣定理在二維上的推廣。
一維Nyquist采樣定理:如果一維信號x(t) 是頻帶受限信號,其最高頻率為fc,當采樣頻率滿足 fs ≥2fc 時,則原信號可由離散樣點值精確重建。
二維Nyguist采樣定理: 原始圖像在水平方向的頻率為um,在垂直方向的頻率為vm,只要水平方向的空間采樣頻率u0≥2um,垂直方向的空間采樣頻率v0≥2vm,即采樣點的水平間隔Δx≤(1/2um) ,垂直間隔Δy≤(1/2vm) ,則圖像可被精確地恢復。
可見當量化層數 K 加大,則每層長度 L 縮小,總的均方誤差也成平方比例縮小,更有利於保持原圖的灰度信息。
代數運算
對於兩幅輸入圖像進行點對點的加、減、乘、除計算而得到輸出圖像。代數運算的一般表達式如下:
(1)加法應用: 對同一場景的多幅圖像求平均值,達到降低加性隨機噪聲的影響;將一幅圖像的內容疊加到另一幅圖像上,達到二次曝光的效果。
(2)減法應用:對同一景物在不同時間的圖像或同一景物在不同波段的圖像相減(減影技術)。
應用:利用圖像間的差異信息,指導動態監測、運動目標檢測和跟蹤;圖像背景消除及目標識別的工作。減影技術在醫學上應用廣泛。
減法應用:混合圖像分離
(3)乘法應用:可用來遮掉圖像的某些部分( 掩膜圖像)
在掩膜圖像中要保留部分的值為1,要被抑制掉的區域則值為零。使用掩膜圖像去乘一幅圖像,可抹去圖像的某部分,即使該不部分為零。
(4)除法應用:除法操作給出的是相應像素值的變化比率,而不是每個像素值的絕對差值,圖像相除又稱比值處理,是遙感圖像處理中常用的方法。
數字圖像處理的特點
1、圖像信息量大、數據量也大;
在數字圖像處理中,一幅圖像可看成是由圖像矩陣中的像素(pixel)組成的,每個像素的灰度級至少要 6bit(單色圖像)來表示,一般采用8bit(彩色圖像),高精度的可用12bit 或 16bit。
2、圖像處理技術綜合性強;
在數字圖像處理中涉及的基礎知識和專業技術相當廣泛。一般來說涉及通信技術、計算機技術、電子技術、電視技術及數學、物理等方面的基礎知識。
3、圖像信息理論與通信理論密切相關。
早在1948年Shannon發表了"A mathematical Theory of Communication"(通信中的數學理論)一文,它奠定了信息論的基礎。此后,信息理論已滲透到了各個領域。圖像信息論也屬於信息論科學中的一個分支。
圖像信息論是在通信理論研究的基礎上發展起來的。通信研究的是一維時間信息;圖像研究的是二維空間信息。也就是說,圖像理論是把通信中的一維問題推廣到二維空間上來研究的。
三、圖像質量的評價
圖像質量評價研究已成為圖像信息工程的基礎技術之一,當前對圖像質量的評估方法主要分成兩類
主觀評價—通過人眼主觀視覺效果進行判斷,方法與標准已相對完善
客觀評價—通過客觀的測量給出量化指標
客觀評價-傳統客觀評價方法
通過計算恢復圖像偏離原始圖像的誤差來衡量恢復圖像的質量,最常用的有均方誤差(MSE)和峰值信噪比(PSNR)
其中N、M分別是x方向、y方向圖像像素點的個數,fij和f'ij分別是原始圖像和測試圖像在(i, j)點上的取值,L是圖像中灰度取值的范圍,對8比特的灰度圖像而言,L=255。
客觀評價-基於視覺感知的測量方法
從視覺心理學角度,視覺是一種積極的感受行為,不僅與生理因素有關,還在相當大的程度上取決於心理因素;人們在觀察和理解圖像時往往會不自覺地對其中某些區域產生興趣,這些區域稱之為"感興趣區(ROI)",整幅圖像的視覺質量往往取決於ROI的質量;人們探索各種ROI評價方式。如通過對圖像中不同區域的加權突出人眼對ROI的興趣程度