SIFT
主要步驟
SIFT(Scale-invariant feature transform尺度不變特征轉換)是一種檢測局部特征的算法,該算法通過求一幅圖中的特征點(interest points,or corner points)及其有關scale 和 orientation 的描述子得到特征並進行圖像特征點匹配,獲得了良好效果,
1)、尺度空間的生成;(尺度空間理論目的是模擬圖像數據的多尺度特征。為了有效的在尺度空間檢測到穩定的關鍵點,提出了高斯差分尺度空間(DOG scale-space)。利用不同尺度的高斯差分核與圖像卷積生成。)
2)、檢測尺度空間極值點;(每一個采樣點要和它所有的相鄰點比較,看其是否比它的圖像域和尺度域的相鄰點大或者小)
3)、精確定位極值點;(通過擬和三維二次函數以精確確定關鍵點的位置和尺度(達到亞像素精度),同時去除低對比度的關鍵點和不穩定的邊緣響應點)
4)、為每個關鍵點指定方向參數;(給特征點賦值一個128維方向參數)
5)、關鍵點描述子的生成
6) 根據SIFT進行Match (生成了A、B兩幅圖的描述子,(分別是k1*128維和k2*128維),就將兩圖中各個scale(所有scale)的描述子進行匹配,匹配上128維即可表示兩個特征點match上了。)
Harris角點算法
當一個窗口在圖像上移動,在平滑區域如圖(a),窗口在各個方向上沒有變化。在邊緣上如圖(b),窗口在邊緣的方向上沒有變化。在角點處如圖(c),窗口在各個方向上具有變化。Harris角點檢測正是利用了這個直觀的物理現象,通過窗口在各個方向上的變化程度,決定是否為角點。
NCC算法
NCC(normalized cross correlation)算法,歸一化互相關匹配法,是基於圖像灰度信息的匹配方法。
圖像匹配的方法主要有三種:基於灰度,基於特征,基於變換域。
RANSAC算法隨機抽樣一致算法(Random sample consensus)
1)假定模型2)找出距離擬合曲線容差范圍內的點,並統計點的個數3)每一次擬合后,容差范圍內都有對應的數據點數,找出數據點個數最多的情況,就是最終的擬合結果
Canny算子求邊緣點具體算法步驟如下:
1. 用高斯濾波器平滑圖像.
2. 用一階偏導有限差分計算梯度幅值和方向
3. 對梯度幅值進行非極大值抑制
4. 用雙閾值算法檢測和連接邊緣.
混合高斯模型
用GMM對背景建模的基本思想是把每一個像素點所呈現的顏色用K個高斯分布的疊加來表示,通常K取3-5之間。將像素點所呈現的顏色X認為是隨機變量,則在每時刻t=1,…,T所得到視頻幀圖像的像素值只是隨機變量X的采樣值(觀值)。
在進行前景檢測前,先對背景進行訓練,對每一幀圖像中每個背景采用一個混合高斯模型進行模擬,背景一旦提取出來,前景的檢測就簡單了,檢查像素是否與背景的高斯模型匹配,匹配是背景,不匹配就是前景。
所以關鍵就是混合高斯背景模型的建立。
GMM之所以能夠將前景和背景分開是基於如下兩點事實的:
(1)在長期觀測的場景中,背景占大多數時間,更多的數據是支持背景分布的
(2)即使是相對顏色一致的運動物體也會比背景產生更多變化,況且一般情況下物體都是帶有不同顏色的
算法大致這樣:
首先初始化預先定義的幾個高斯模型,對高斯模型中的參數進行初始化,並求出之后將要用到的參數。其次,對於每一幀中的每一個像素進行處理,看其是否匹配某個模型,若匹配,則將其歸入該模型中,並對該模型根據新的像素值進行更新,若不匹配,則以該像素建立一個高斯模型,初始化參數,代替原有模型中最不可能的模型。最后選擇前面幾個最有可能的模型作為背景模型,為背景目標提取做鋪墊。
圖像去模糊
不同原因導致的模糊往往需要不同的處理方法。從技術方面來向,模糊圖像處理方法主要分為三大類,分別是圖像增強、圖像復原和超分辨率重構。
對於運動引起的圖像模糊,最簡單的方法是直接做逆濾波,但是逆濾波對加性噪聲特別敏感,使得恢復的圖像幾乎不可用。最小均方差(維納)濾波用來去除含有噪聲的模糊圖像,其目標是找到未污染圖像的一個估計,使它們之間的均方差最小,可以去除噪聲,同時清晰化模糊圖像。
圖像分割
1)閾值分割 2)區域分割 a. 區域生長 b. 區域分裂合並 3) 邊緣分割4) 直方圖法
分水嶺算法是一種圖像區域分割法,在分割的過程中,它會把跟臨近像素間的相似性作為重要的參考依據,從而將在空間位置上相近並且灰度值相近(求梯度)的像素點互相連接起來構成一個封閉的輪廓。分水嶺算法常用的操作步驟:彩色圖像灰度化,然后再求梯度圖,最后在梯度圖的基礎上進行分水嶺算法,求得分段圖像的邊緣線。
分水嶺算法的計算過程是一個迭代標注過程。分兩個步驟,一個是排序過程,一個是淹沒過程。首先對每個像素的灰度級進行從低到高排序,然后在從低到高實現淹沒過程中,對每一個局部極小值在h階高度的影響域采用先進先出(FIFO)結構進行判斷及標注。
Criminisi算法
基於樣例的圖像修復算法的精髓在於采用小塊填補的方法,相對於點填補的方法來說提高了填補速度和精度,使用小塊的數據值和置信度值來定義各小塊的優先級,從而使填補過程有序地進行,最終使填補出來的結構和紋理都不失流暢感。
置信度值C(p)反應了以p點為中心的小塊所含有效點的多少,其值越大,表示p點周圍的有效點越多。數據值D(p)體現了p點周圍線性結構信息的強弱,其值越大,表示p點周圍具有更強的線性結構,即從ψ p開始修復能更好地保持這種結構信息,減少修復的誤差。
無監視學習下的加強人臉關鍵點檢測器