圖像表示與圖像處理的基本概念

本文轉載自查看原文 2020-03-29 14:39 1034 CV

一、圖像及其數字化表示

1.1 人類對光本性認識

光微粒子：牛頓 -> 幾何光學 -> 直線傳播 --能解釋的現象：反射、折射、透射
光波：惠更斯等 -> 波動光學 -> 波長、頻率 --能解釋的現象：干涉、衍射
光(量)子：愛因斯坦、普朗克 -> 量子光學 -> 能量量子化（不連續） --能解釋的現象：光電效應、康普頓散射

1.2 圖像的顏色

常用的顏色模型

RGB（紅、綠、藍）-> 主動產生顏色光源（顯示器）
CMYK（青、品紅、黃、黑） (Cyan, Magenta, Yellow, Black) -> 用於印刷、繪畫等
HSI（色調、色飽和度、亮度） (Hue, Saturation, Intensity) ->用於調整顏色分量

1.2.1 R、G、B 三基色

人眼的感受光譜范圍約為380~780 nm，原則上可采用各種不同的三色組為標准化，1931年國際照明委員會(CIE)作了統一規定，選定波長700nm、546.1nm和435.8nm的單色光作為紅、綠、藍三原色，又稱為物理三基色。任意彩色的顏色方程為：

利用RGB可產生大量的顏色，例如：RGB灰度級分別為256時，可產生224 ≈ 16.8 M 種顏色

顏色空間：描述顏色的三維空間坐標，一個顏色定義為顏色空間的一個點

RGB顏色模型是三維直角坐標顏色系統中的一個單位正方體，在正方體的主對角線上，各原色的量相等，產生由暗到亮的白色，即灰度。（0，0，0）為黑，（1，1，1）為白，正方體的其他6個角點分別為紅、黃、綠、青、藍和品紅

1.2.2 顏色模型—CMY模型

CMY為相減混色，它與相加混色的RGB空間正好互補，也即用白色減去RGB空間中的某一色彩值就等於同樣色彩在CMY空間中的值

由於彩色墨水和顏料的化學特性，用等量的CMY三基色得到的黑色不是真正的黑色，因此在印刷術中常加一種真正的黑色，所以CMY又寫成CMYK

1.2.3 顏色模型—HSI 模型

從人的視覺系統出發，用色調(Hue)、色飽和度( Saturation或Chroma)和亮度(Intensity 或Brightness)來描述色彩

它比RGB色彩空間更符合人的視覺特性

H、S、I 可以分開處理而且相互獨立
在HSI色彩空間可以大大簡化圖像分析和處理的工作量
HSI色彩空間和RGB色彩空間只是同一物理量的不同表示法，因而它們之間存在着轉換關系
在圖像處理和計算機視覺中大量算法都可在HSI色彩空間中方便地使用

I：表示光照強度或稱為亮度，它確定了像素的整體亮度，而不管其顏色是什么。其最亮值為1，0為最暗。

H：表示色調，由角度表示(0~360º)。反映了該顏色最接近什么樣的光譜波長。0º為紅色，120º為綠色，240º為藍色。

S：表示色飽和度，色飽和度參數是色環的原點到彩色點的半徑長度。在環的外圍圓周是純的或稱飽和的顏色，其飽和度值為1。在中心是中性（灰）影調，即飽和度為0

1.2.4 顏色模型轉換

1.3 圖像表示

物理圖像—可用連續函數進行較好地描述、分析與處理
數字圖像—時空與幅度均為離散的數據矩陣

圖像的采樣與量化

"分辨率：在一定的面積內取多少個點，或者多少個像素；
"數據深度"：記錄每個點的某一因素（亮度/色度）的數據位數。

采樣點數越多，圖像質量越好。當采樣點數減少時，圖上的塊狀效應就逐漸明顯。當圖像的采樣點數一定時，量化級數越多，圖像質量越好。量化級數最小的極端情況就是二值圖像，圖像出現假輪廓。

不同量化級別對圖像質量的影響。顯然，無論從平面的取點還是記錄數據的深度來講，采樣形成的圖像與母本必然有一定的差距，丟掉了一些數據。但這個差距如果控制得相當的小，那么這個差距就是可以接受的。

傳統圖像的描述方式與數據結構

矩陣（matrices）---黑白、灰度、彩色、…… /鏈表（chains）/拓撲結構（Topological data structures）/ 關系結構（Relational structures） ……

矩陣—黑白圖像（二值圖像）: 指圖像的每個像素只能是黑或者白，沒有中間的過渡，故又稱為二值圖像。2值圖像的像素值為0、1。

矩陣—灰度圖像:灰度圖像像素的灰度級通常為8Bits，即0~255。"0"表示純黑色,"255"表示純白色。現實圖像的類型基本上可表示為灰度圖像，其像素灰度級常用的為8 Bits，但向着10 Bits、12 Bits、16 Bits發展。

矩陣—灰度圖像:

矩陣—彩色圖像: 通常彩色圖像是指每個像素的信息由RGB三原色構成的圖像，其中RGB是由不同的灰度級來描述的。

圖片格式：https://www.jianshu.com/p/f6bde0058c94

1.4 顏色模型的應用-利用HSI模型特性消除紅眼

"紅眼"—閃光燈照相的結果:在HSI空間可定義紅眼為: -π/4 < 色調<π/4 色飽和度 > 0.3

處理算法

在臉部的特定區域進行色空間轉換RGB -> HSI
測試每一點像素
如果：-π/4 < H <π/4 and S>0.3
則該像素為紅眼像素，使其成為灰色：S=0

二、數字圖像處理

對數字圖像處理的定義：

對一個物體的數字表示—二維矩陣—施加一系列的操作，以得到所期望的結果。，常借助於連續函數的分析結果與處理方法進行離散處理，"數字圖像處理"不是指"處理數字圖像"，而是指"圖像的數字處理"

數字圖像處理方式：

將一幅圖像變為另一幅經過加工的圖像，圖像到圖像的過程
將一幅圖像轉化為一種非圖像的表示，分析、識別與理解的過程

數字圖像處理研究的內容

圖像變換：改變圖像的空間或頻譜分布，獲取或突出感興趣信息

空域變換：放大、縮小、旋轉……
頻域變換：傅立葉變換、離散余弦變換、Walsh變換小波變換……

圖像增強和復原

提高圖像質量（去除噪聲、提高圖像的清晰度）
灰度修正、圖像平滑、幾何校正、圖像銳化……

圖像的理解和識別

從圖像中提取抽象化的特定信息
統計模式分類、句法模式分類……

連續與離散

模擬圖像：空間位置的連續性；每個位置上的光強度變化連續性
數字圖像:采樣(Sample):空間離散化,采樣(Sample):空間離散化

圖像采樣需解決的首要問題：從采樣點精確恢復原圖像所需要的最小的采樣點個數，即各采樣點在水平和垂直方向的最大間隔。該問題可看作一維采樣定理在二維上的推廣。

一維Nyquist采樣定理:如果一維信號x(t) 是頻帶受限信號，其最高頻率為fc，當采樣頻率滿足 fs ≥2fc 時，則原信號可由離散樣點值精確重建。

二維Nyguist采樣定理: 原始圖像在水平方向的頻率為um，在垂直方向的頻率為vm，只要水平方向的空間采樣頻率u0≥2um，垂直方向的空間采樣頻率v0≥2vm，即采樣點的水平間隔Δx≤(1/2um) ，垂直間隔Δy≤(1/2vm) ，則圖像可被精確地恢復。

可見當量化層數 K 加大，則每層長度 L 縮小，總的均方誤差也成平方比例縮小，更有利於保持原圖的灰度信息。

代數運算

對於兩幅輸入圖像進行點對點的加、減、乘、除計算而得到輸出圖像。代數運算的一般表達式如下：

（1）加法應用：對同一場景的多幅圖像求平均值，達到降低加性隨機噪聲的影響；將一幅圖像的內容疊加到另一幅圖像上，達到二次曝光的效果。

（2）減法應用：對同一景物在不同時間的圖像或同一景物在不同波段的圖像相減（減影技術）。

應用：利用圖像間的差異信息，指導動態監測、運動目標檢測和跟蹤；圖像背景消除及目標識別的工作。減影技術在醫學上應用廣泛。

減法應用：混合圖像分離

（3）乘法應用：可用來遮掉圖像的某些部分( 掩膜圖像)

在掩膜圖像中要保留部分的值為1，要被抑制掉的區域則值為零。使用掩膜圖像去乘一幅圖像，可抹去圖像的某部分，即使該不部分為零。

（4）除法應用：除法操作給出的是相應像素值的變化比率，而不是每個像素值的絕對差值，圖像相除又稱比值處理，是遙感圖像處理中常用的方法。

數字圖像處理的特點

1、圖像信息量大、數據量也大；

在數字圖像處理中，一幅圖像可看成是由圖像矩陣中的像素（pixel）組成的，每個像素的灰度級至少要 6bit（單色圖像）來表示，一般采用8bit（彩色圖像），高精度的可用12bit 或 16bit。

2、圖像處理技術綜合性強；

在數字圖像處理中涉及的基礎知識和專業技術相當廣泛。一般來說涉及通信技術、計算機技術、電子技術、電視技術及數學、物理等方面的基礎知識。

3、圖像信息理論與通信理論密切相關。

早在1948年Shannon發表了"A mathematical Theory of Communication"（通信中的數學理論）一文，它奠定了信息論的基礎。此后，信息理論已滲透到了各個領域。圖像信息論也屬於信息論科學中的一個分支。

圖像信息論是在通信理論研究的基礎上發展起來的。通信研究的是一維時間信息；圖像研究的是二維空間信息。也就是說，圖像理論是把通信中的一維問題推廣到二維空間上來研究的。

三、圖像質量的評價

圖像質量評價研究已成為圖像信息工程的基礎技術之一，當前對圖像質量的評估方法主要分成兩類

主觀評價—通過人眼主觀視覺效果進行判斷，方法與標准已相對完善

客觀評價—通過客觀的測量給出量化指標

客觀評價-傳統客觀評價方法

通過計算恢復圖像偏離原始圖像的誤差來衡量恢復圖像的質量，最常用的有均方誤差(MSE)和峰值信噪比(PSNR)

其中N、M分別是x方向、y方向圖像像素點的個數，fij和f'ij分別是原始圖像和測試圖像在(i, j)點上的取值，L是圖像中灰度取值的范圍，對8比特的灰度圖像而言，L=255。

客觀評價-基於視覺感知的測量方法

從視覺心理學角度，視覺是一種積極的感受行為，不僅與生理因素有關，還在相當大的程度上取決於心理因素；人們在觀察和理解圖像時往往會不自覺地對其中某些區域產生興趣，這些區域稱之為"感興趣區(ROI)"，整幅圖像的視覺質量往往取決於ROI的質量；人們探索各種ROI評價方式。如通過對圖像中不同區域的加權突出人眼對ROI的興趣程度

免責聲明！

本站轉載的文章為個人學習借鑒使用，本站對版權不負任何法律責任。如果侵犯了您的隱私權益，請聯系本站郵箱yoyou2525@163.com刪除。

猜您在找 數字圖像處理入門（一）-基本概念數字圖像處理_基本概念 Python圖像處理庫(PIL)--簡介和基本概念《圖像處理》第9章目標表示與描述圖像處理之基礎---方差、標准差、協方差基本概念圖像與視頻的基本概念圖像處理--圖像特效圖像處理 bimg Java圖像處理 qt之圖像處理