目標:將數張有重疊部分的圖像通過特征點檢測,匹配,圖像變換拼成一幅無縫的全景圖或高分辨率圖像
在圖像拼接中首先利用SIFT算法提取圖像特征進而進行特征匹配,繼而使用RANSAC算法對特征匹配的結果進行優化,接着利用圖像變換結構進行圖像映射,最終進行圖像融合。
在圖像拼接過程中,運用SIFT局部描述算子檢測圖像中的關鍵點和特征,SIFT特征是基於物體上的一些局部外觀的興趣點而與影像的大小和旋轉無關。對於光線、噪聲、些微視角改變的容忍度也相當高,所以用來檢測要拼接圖像的特征及關鍵點就很有優勢。而接下來即步驟三是找到重疊的圖片部分,連接所有圖片之后就可以形成一個基本的全景圖了。匹配圖片最常用的方式是采用RANSAC(RANdom SAmple Consensus, 隨機抽樣一致),用此排除掉不符合大部分幾何變換的匹配。之后利用這些匹配的點來估算單應矩陣”(Homography Estimation),也就是將其中一張圖像通過關聯性和另一張匹配。
使用的算法:
1. 利用SIFT方法檢測特征點
def detectAndDescribe(image):
# 將彩色圖片轉換成灰度圖
gray = cv2.cvtColor(image, cv2.COLOR_BGR2GRAY)
# 建立SIFT生成器
descriptor = cv2.xfeatures2d.SIFT_create()
# 檢測SIFT特征點,並計算描述子
(kps, features) = descriptor.detectAndCompute(image, None)
# 將結果轉換成NumPy數組
kps = np.float32([kp.pt for kp in kps])
# 返回特征點集,及對應的描述特征
return (kps, features)
2. 將檢測到的特征點進行匹配
def matchKeypoints(kpsA, kpsB, featuresA, featuresB, ratio, reprojThresh):
# 建立暴力匹配器
matcher = cv2.BFMatcher()
# 使用KNN檢測來自A、B圖的SIFT特征匹配對,K=2
rawMatches = matcher.knnMatch(featuresA, featuresB, 2)
matches = []
for m in rawMatches:
# 當最近距離跟次近距離的比值小於ratio值時,保留此匹配對
if len(m) == 2 and m[0].distance < m[1].distance * ratio:
# 存儲兩個點在featuresA, featuresB中的索引值
matches.append((m[0].trainIdx, m[0].queryIdx))
# 當篩選后的匹配對大於4時,計算視角變換矩陣
if len(matches) > 4:
# 獲取匹配對的點坐標
ptsA = np.float32([kpsA[i] for (_, i) in matches])
ptsB = np.float32([kpsB[i] for (i, _) in matches])
# 計算視角變換矩陣
(H, status) = cv2.findHomography(ptsA, ptsB, cv2.RANSAC, reprojThresh)
# 返回結果
return (matches, H, status)
# 如果匹配對小於4時,返回None
return None
3. 將匹配的特征點可視化
def drawMatches(imageA, imageB, kpsA, kpsB, matches, status):
# 初始化可視化圖片,將A、B圖左右連接到一起
(hA, wA) = imageA.shape[:2]
(hB, wB) = imageB.shape[:2]
vis = np.zeros((max(hA, hB), wA + wB, 3), dtype="uint8")
vis[0:hA, 0:wA] = imageA
vis[0:hB, wA:] = imageB
# 聯合遍歷,畫出匹配對
for ((trainIdx, queryIdx), s) in zip(matches, status):
# 當點對匹配成功時,畫到可視化圖上
if s == 1:
# 畫出匹配對
ptA = (int(kpsA[queryIdx][0]), int(kpsA[queryIdx][1]))
ptB = (int(kpsB[trainIdx][0]) + wA, int(kpsB[trainIdx][1]))
cv2.line(vis, ptA, ptB, (0, 255, 0), 1)
# 返回可視化結果
return vis
4. 圖像拼接
def stitch(images, ratio=0.75, reprojThresh=4.0,showMatches=False):
#獲取輸入圖片
(imageB, imageA) = images
#檢測A、B圖片的SIFT關鍵特征點,並計算特征描述子
(kpsA, featuresA) = detectAndDescribe(imageA)
(kpsB, featuresB) = detectAndDescribe(imageB)
# 匹配兩張圖片的所有特征點,返回匹配結果
M = matchKeypoints(kpsA, kpsB, featuresA, featuresB, ratio, reprojThresh)
# 如果返回結果為空,沒有匹配成功的特征點,退出算法
if M is None:
return None
# 否則,提取匹配結果
# H是3x3視角變換矩陣
(matches, H, status) = M
# 將圖片A進行視角變換,result是變換后圖片
result = cv2.warpPerspective(imageA, H, (imageA.shape[1] + imageB.shape[1], imageA.shape[0]))
cv_show('result', result)
# 將圖片B傳入result圖片最左端
result[0:imageB.shape[0], 0:imageB.shape[1]] = imageB
cv_show('result', result)
# 檢測是否需要顯示圖片匹配
if showMatches:
# 生成匹配圖片
vis = drawMatches(imageA, imageB, kpsA, kpsB, matches, status)
# 返回結果
return (result, vis)
# 返回匹配結果
return result