圖像表示與圖像處理的基本概念


目錄

  1. 圖像及其數字化表示
  2. 數字圖像處理
  3. 圖像質量的評價

一、圖像及其數字化表示

1.1 人類對光本性認識

  • 光微粒子:牛頓 -> 幾何光學 -> 直線傳播 --能解釋的現象:反射、折射、透射
  • 光波:惠更斯等 -> 波動光學 -> 波長、頻率 --能解釋的現象:干涉、衍射
  • 光(量)子:愛因斯坦、普朗克 -> 量子光學 -> 能量量子化(不連續) --能解釋的現象:光電效應、康普頓散射

1.2 圖像的顏色

常用的顏色模型

  • RGB(紅、綠、藍)-> 主動產生顏色光源(顯示器)
  • CMYK(青、品紅、黃、黑) (Cyan, Magenta, Yellow, Black) -> 用於印刷、繪畫等
  • HSI(色調、色飽和度、亮度) (Hue, Saturation, Intensity) ->用於調整顏色分量

1.2.1 RGB 三基色

人眼的感受光譜范圍約為380~780 nm,原則上可采用各種不同的三色組為標准化,1931年國際照明委員會(CIE)作了統一規定,選定波長700nm、546.1nm和435.8nm的單色光作為紅、綠、藍三原色,又稱為物理三基色。任意彩色的顏色方程為:

利用RGB可產生大量的顏色,例如:RGB灰度級分別為256時,可產生224 ≈ 16.8 M 種顏色

顏色空間:描述顏色的三維空間坐標, 一個顏色定義為顏色空間的一個點

RGB顏色模型是三維直角坐標顏色系統中的一個單位正方體,在正方體的主對角線上,各原色的量相等,產生由暗到亮的白色,即灰度。(0,0,0)為黑,(1,1,1)為白,正方體的其他6個角點分別為紅、黃、綠、青、藍和品紅

1.2.2 顏色模型—CMY模型

CMY為相減混色,它與相加混色的RGB空間正好互補,也即用白色減去RGB空間中的某一色彩值就等於同樣色彩在CMY空間中的值

由於彩色墨水和顏料的化學特性,用等量的CMY三基色得到的黑色不是真正的黑色,因此在印刷術中常加一種真正的黑色,所以CMY又寫成CMYK

1.2.3 顏色模型—HSI 模型

從人的視覺系統出發,用色調(Hue)、色飽和度( Saturation或Chroma)和亮度(Intensity 或Brightness)來描述色彩

它比RGB色彩空間更符合人的視覺特性

  • H、S、I 可以分開處理而且相互獨立
  • 在HSI色彩空間可以大大簡化圖像分析和處理的工作量
  • HSI色彩空間和RGB色彩空間只是同一物理量的不同表示法,因而它們之間存在着轉換關系
  • 在圖像處理和計算機視覺中大量算法都可在HSI色彩空間中方便地使用

I:表示光照強度或稱為亮度,它確定了像素的整體亮度,而不管其顏色是什么。其最亮值為1,0為最暗。

H:表示色調,由角度表示(0~360º)。反映了該顏色最接近什么樣的光譜波長。0º為紅色,120º為綠色,240º為藍色。

S:表示色飽和度,色飽和度參數是色環的原點到彩色點的半徑長度。在環的外圍圓周是純的或稱飽和的顏色,其飽和度值為1。在中心是中性(灰)影調,即飽和度為0

1.2.4 顏色模型轉換

1.3 圖像表示

  • 物理圖像—可用連續函數進行較好地描述、分析與處理
  • 數字圖像—時空與幅度均為離散的數據矩陣

圖像的采樣與量化

  • "分辨率:在一定的面積內取多少個點,或者多少個像素;
  • "數據深度":記錄每個點的某一因素(亮度/色度)的數據位數。

采樣點數越多,圖像質量越好。當采樣點數減少時,圖上的塊狀效應就逐漸明顯。當圖像的采樣點數一定時,量化級數越多,圖像質量越好。量化級數最小的極端情況就是二值圖像,圖像出現假輪廓。

不同量化級別對圖像質量的影響。顯然,無論從平面的取點還是記錄數據的深度來講,采樣形成的圖像與母本必然有一定的差距,丟掉了一些數據。但這個差距如果控制得相當的小,那么這個差距就是可以接受的。

傳統圖像的描述方式與數據結構

矩陣(matrices)---黑白、灰度、彩色、…… /鏈表(chains)/拓撲結構(Topological data structures)/ 關系結構(Relational structures) ……

矩陣—黑白圖像(二值圖像): 指圖像的每個像素只能是黑或者白,沒有中間的過渡,故又稱為二值圖像。2值圖像的像素值為01

矩陣—灰度圖像:灰度圖像像素的灰度級通常為8Bits,即0~255。"0"表示 純黑色,"255"表示純白色。現實圖像的類型基本上可表示為灰度圖像,其像素灰度級常用的為8 Bits,但向着10 Bits、12 Bits、16 Bits發展。

矩陣—灰度圖像:

矩陣—彩色圖像: 通常彩色圖像是指每個像素的信息由RGB三原色構成的圖像,其中RGB是由不同的灰度級來描述的。

圖片格式:https://www.jianshu.com/p/f6bde0058c94

1.4 顏色模型的應用-利用HSI模型特性消除紅眼

"紅眼"—閃光燈照相的結果:在HSI空間可定義紅眼為: -π/4 < 色調<π/4 色飽和度 > 0.3

處理算法

  • 在臉部的特定區域進行色空間轉換RGB -> HSI
  • 測試每一點像素
  • 如果:-π/4 < H <π/4 and S>0.3
  • 則該像素為紅眼像素,使其成為灰色:S=0

二、數字圖像處理

對數字圖像處理的定義:

對一個物體的數字表示—二維矩陣—施加一系列的操作,以得到所期望的結果。,常借助於連續函數的分析結果與處理方法進行離散處理,"數字圖像處理"不是指"處理數字圖像",而是指"圖像的數字處理"

數字圖像處理方式:

  • 將一幅圖像變為另一幅經過加工的圖像,圖像 到圖像的過程
  • 將一幅圖像轉化為一種非圖像的表示,分析、識別與理解的過程

數字圖像處理研究的內容

圖像變換:改變圖像的空間或頻譜分布,獲取或突出感興趣信息

  • 空域變換:放大、縮小、旋轉……
  • 頻域變換:傅立葉變換、離散余弦變換、Walsh變換 小波變換……

圖像增強和復原

  • 提高圖像質量(去除噪聲、提高圖像的清晰度)
  • 灰度修正、圖像平滑、幾何校正、圖像銳化……

圖像的理解和識別

  • 從圖像中提取抽象化的特定信息
  • 統計模式分類、句法模式分類……

連續與離散

  • 模擬圖像:空間位置的連續性;每個位置上的光強度變化連續性
  • 數字圖像:采樣(Sample):空間離散化,采樣(Sample):空間離散化

圖像采樣需解決的首要問題:從采樣點精確恢復原圖像所需要的最小的采樣點個數,即各采樣點在水平和垂直方向的最大間隔。該問題可看作一維采樣定理在二維上的推廣。

一維Nyquist采樣定理:如果一維信號x(t) 是頻帶受限信號,其最高頻率為fc,當采樣頻率滿足 fs ≥2fc 時,則原信號可由離散樣點值精確重建。

二維Nyguist采樣定理: 原始圖像在水平方向的頻率為um,在垂直方向的頻率為vm,只要水平方向的空間采樣頻率u0≥2um,垂直方向的空間采樣頻率v0≥2vm,即采樣點的水平間隔Δx≤(1/2um) ,垂直間隔Δy≤(1/2vm) ,則圖像可被精確地恢復。

可見當量化層數 K 加大,則每層長度 L 縮小,總的均方誤差也成平方比例縮小,更有利於保持原圖的灰度信息。

代數運算

對於兩幅輸入圖像進行點對點的加、減、乘、除計算而得到輸出圖像。代數運算的一般表達式如下:

(1)加法應用: 對同一場景的多幅圖像求平均值,達到降低加性隨機噪聲的影響;將一幅圖像的內容疊加到另一幅圖像上,達到二次曝光的效果。

(2)減法應用:對同一景物在不同時間的圖像或同一景物在不同波段的圖像相減(減影技術)。

應用:利用圖像間的差異信息,指導動態監測、運動目標檢測和跟蹤;圖像背景消除及目標識別的工作。減影技術在醫學上應用廣泛。

減法應用:混合圖像分離

(3)乘法應用:可用來遮掉圖像的某些部分( 掩膜圖像)

在掩膜圖像中要保留部分的值為1,要被抑制掉的區域則值為零。使用掩膜圖像去乘一幅圖像,可抹去圖像的某部分,即使該不部分為零。

(4)除法應用:除法操作給出的是相應像素值的變化比率,而不是每個像素值的絕對差值,圖像相除又稱比值處理,是遙感圖像處理中常用的方法。

數字圖像處理的特點

1、圖像信息量大、數據量也大;

在數字圖像處理中,一幅圖像可看成是由圖像矩陣中的像素(pixel)組成的,每個像素的灰度級至少要 6bit(單色圖像)來表示,一般采用8bit(彩色圖像),高精度的可用12bit 或 16bit。

2、圖像處理技術綜合性強;

在數字圖像處理中涉及的基礎知識和專業技術相當廣泛。一般來說涉及通信技術、計算機技術、電子技術、電視技術及數學、物理等方面的基礎知識。

3、圖像信息理論與通信理論密切相關。

早在1948年Shannon發表了"A mathematical Theory of Communication"(通信中的數學理論)一文,它奠定了信息論的基礎。此后,信息理論已滲透到了各個領域。圖像信息論也屬於信息論科學中的一個分支。

圖像信息論是在通信理論研究的基礎上發展起來的。通信研究的是一維時間信息;圖像研究的是二維空間信息。也就是說,圖像理論是把通信中的一維問題推廣到二維空間上來研究的。

三、圖像質量的評價

圖像質量評價研究已成為圖像信息工程的基礎技術之一,當前對圖像質量的評估方法主要分成兩類

主觀評價—通過人眼主觀視覺效果進行判斷,方法與標准已相對完善

客觀評價—通過客觀的測量給出量化指標

客觀評價-傳統客觀評價方法

通過計算恢復圖像偏離原始圖像的誤差來衡量恢復圖像的質量,最常用的有均方誤差(MSE)和峰值信噪比(PSNR)

其中N、M分別是x方向、y方向圖像像素點的個數,fij和f'ij分別是原始圖像和測試圖像在(i, j)點上的取值,L是圖像中灰度取值的范圍,對8比特的灰度圖像而言,L=255。

客觀評價-基於視覺感知的測量方法

從視覺心理學角度,視覺是一種積極的感受行為,不僅與生理因素有關,還在相當大的程度上取決於心理因素;人們在觀察和理解圖像時往往會不自覺地對其中某些區域產生興趣,這些區域稱之為"感興趣區(ROI)",整幅圖像的視覺質量往往取決於ROI的質量;人們探索各種ROI評價方式。如通過對圖像中不同區域的加權突出人眼對ROI的興趣程度

   

   

   


免責聲明!

本站轉載的文章為個人學習借鑒使用,本站對版權不負任何法律責任。如果侵犯了您的隱私權益,請聯系本站郵箱yoyou2525@163.com刪除。



 
粵ICP備18138465號   © 2018-2025 CODEPRJ.COM