圖片存儲原理:
主流顏色空間:1.RGB三通道彩色圖:圖片——>三維矩陣
2.單通道灰度圖:Gray=R*0.3+G*0.59+B*0.11
圖像增強
目標:
1.改善圖像的視覺效果
2.轉換為更適合於人或機器分析處理的形式
3.突出對人或機器分析有意義的信息
4.抑制無用信息,提高圖像的使用價值;
具體方法:
包括圖像銳化,平滑、去噪,灰度調整(對比度增強)
點運算:
直方圖:對圖片數據、特征分布的一種統計(1.灰度、顏色 2.梯度\邊緣、形狀、紋理 3.局部特征點、視覺詞匯)
直方圖均衡化(防止明暗差別過大):實質上是對圖像進行非線性的拉伸。重新分配各個灰度單位中的像素點數量,使一定灰度范圍內像素點數量的值大致相等
直方圖均衡的經典算法對整幅圖像的像素使用相同的變換,如果圖像中包括明顯亮的或者暗的區域,則經典算法作用有限。
自適應直方圖均衡(AHE):通過對局部區域進行直方圖均衡,來解決上述問題。移動模板在原始圖片上按特定步長滑動;每次移動后,模板區域內做直防圖均衡,映射后的結果賦值給模板區域內所有點,每個點會有多次賦值,最終的取值為這些賦值的均值。
但是AHE會過度放大圖像中相對均勻區域的噪音,可采用限制對比度自適應直方圖均(CLAHE)。與普通的自適應直方圖均衡相比,CLAHE的不同地方在於直方圖修剪過程(雙線性插值),用修剪后的直方圖均衡圖像時,圖像對比度會更自然。
1.圖像分塊,以塊為單位;
2.先計算直方圖,然后修剪直方圖,最后均衡;
3.遍歷操作各個圖像塊,進行塊間雙線性插值;

形態學運算
膨脹:圖像中的高亮部分進行膨脹,類似於領域擴張
正向腐蝕(B沿着A的邊走一遍,形成的內部圖案),反向膨脹
開運算:先腐蝕再膨脹,可以去掉目標外的孤立點。
閉運算:先膨脹再腐蝕,可以去掉目標內的孔。
通常,當有噪聲的圖像用閾值二值化后,所得到的邊界是很不平滑的,物體區域具有一些錯判的孔洞,背景區域散布着一些小的噪聲物體,連續的開和閉運算可以顯著的改善這種情況。
空間預處理及其變換
濾波/卷積:在每個圖片位置(x,y)上進行基於淋雨的函數計算。不同功能需要不同的函數(平滑/去噪,梯度/銳化等)
圖片中各點的數值和卷積核中的點對應相乘再相加得到結果
邊界填充:使卷積后的尺度與前相同
補零用的最多,但是補得0過多影響比較大。
高斯金字塔:
圖像金字塔化:先進行圖像平滑,再進行降采樣,根據降采樣頻率,得到一系列尺寸逐漸減小的圖像。
操作:N次(高斯卷積->2倍降采樣)-->n層金字塔
目的:捕捉不同尺寸的物體
拉普拉斯金字塔我感覺就是高斯金字塔的逆過程。
傅里葉變換:
一個信號可以有足夠多個不同頻率和幅值的正余弦波組成。
這我也講不明白,看看吧。
學習地址:https://www.bilibili.com/video/BV1iJ411G741?p=2