深度學習--圖像預處理

本文轉載自查看原文 2020-04-29 17:41 1763

圖片存儲原理：

主流顏色空間：1.RGB三通道彩色圖：圖片——>三維矩陣

2.單通道灰度圖：Gray=R*0.3+G*0.59+B*0.11

圖像增強

目標：

1.改善圖像的視覺效果

2.轉換為更適合於人或機器分析處理的形式

3.突出對人或機器分析有意義的信息

4.抑制無用信息，提高圖像的使用價值;

具體方法:

包括圖像銳化，平滑、去噪，灰度調整(對比度增強)

點運算：

直方圖：對圖片數據、特征分布的一種統計（1.灰度、顏色 2.梯度\邊緣、形狀、紋理 3.局部特征點、視覺詞匯）

直方圖均衡化（防止明暗差別過大）：實質上是對圖像進行非線性的拉伸。重新分配各個灰度單位中的像素點數量，使一定灰度范圍內像素點數量的值大致相等

直方圖均衡的經典算法對整幅圖像的像素使用相同的變換，如果圖像中包括明顯亮的或者暗的區域，則經典算法作用有限。

自適應直方圖均衡(AHE)：通過對局部區域進行直方圖均衡，來解決上述問題。移動模板在原始圖片上按特定步長滑動;每次移動后，模板區域內做直防圖均衡，映射后的結果賦值給模板區域內所有點，每個點會有多次賦值，最終的取值為這些賦值的均值。

但是AHE會過度放大圖像中相對均勻區域的噪音，可采用限制對比度自適應直方圖均(CLAHE)。與普通的自適應直方圖均衡相比，CLAHE的不同地方在於直方圖修剪過程（雙線性插值），用修剪后的直方圖均衡圖像時，圖像對比度會更自然。

CLAHE算法步驟：
1.圖像分塊，以塊為單位;
2.先計算直方圖，然后修剪直方圖，最后均衡;
3.遍歷操作各個圖像塊，進行塊間雙線性插值;

4.與原圖做圖層濾色混合操作。 (可選)

形態學運算

膨脹：圖像中的高亮部分進行膨脹，類似於領域擴張

腐蝕：圖像中的高亮部分被腐蝕，類似於領域被蠶食

正向腐蝕（B沿着A的邊走一遍，形成的內部圖案），反向膨脹

開運算:先腐蝕再膨脹，可以去掉目標外的孤立點。
閉運算:先膨脹再腐蝕，可以去掉目標內的孔。

通常，當有噪聲的圖像用閾值二值化后，所得到的邊界是很不平滑的,物體區域具有一些錯判的孔洞，背景區域散布着一些小的噪聲物體，連續的開和閉運算可以顯著的改善這種情況。

空間預處理及其變換

濾波/卷積：在每個圖片位置（x,y）上進行基於淋雨的函數計算。不同功能需要不同的函數（平滑/去噪，梯度/銳化等）

圖片中各點的數值和卷積核中的點對應相乘再相加得到結果

邊界填充：使卷積后的尺度與前相同

補零用的最多，但是補得0過多影響比較大。

高斯金字塔：

圖像金字塔化：先進行圖像平滑，再進行降采樣，根據降采樣頻率，得到一系列尺寸逐漸減小的圖像。

操作：N次（高斯卷積->2倍降采樣）-->n層金字塔

目的：捕捉不同尺寸的物體

拉普拉斯金字塔我感覺就是高斯金字塔的逆過程。

傅里葉變換：

一個信號可以有足夠多個不同頻率和幅值的正余弦波組成。

這我也講不明白，看看吧。

本站轉載的文章為個人學習借鑒使用，本站對版權不負任何法律責任。如果侵犯了您的隱私權益，請聯系本站郵箱yoyou2525@163.com刪除。

猜您在找 深度學習圖像預處理的幾個步驟深度學習圖像預處理——分類深度學習中圖像預處理為什么要減去均值？深度學習之數據預處理 TensorFlow學習之圖像預處理深度學習中的圖像數據預處理——圖像去均值（image mean or pixel mean）計算機視覺實戰的深度學習實戰二：圖像預處理【深度學習系列】數據預處理 halcon學習筆記——圖像的預處理 PyTorch圖像預處理