【計算機視覺】OpenCV篇(3) - 圖像幾何變換（仿射變換/透視變換）

本文轉載自查看原文 2019-04-24 17:05 851 python/ 計算機視覺

圖像的幾何變換從原理上看主要包括兩種：基於2×3矩陣的仿射變換（平移、縮放、旋轉和翻轉等）、基於3×3矩陣的透視變換。

仿射變換

基本的圖像變換就是二維坐標的變換：從一種二維坐標(x,y)到另一種二維坐標(u,v)的線性變換：

如果寫成矩陣的形式，那就是：

作如下定義：

矩陣T(2×3)就稱為仿射變換的變換矩陣，R為線性變換矩陣，t為平移矩陣，簡單來說，仿射變換就是線性變換+平移。變換后直線依然是直線，平行線依然是平行線，直線間的相對位置關系不變，因此非共線的三個對應點便可確定唯一的一個仿射變換，線性變換4個自由度+平移2個自由度→仿射變換自由度為6。

仿射變換在OpenCV中的實現如下：

import cv2
import numpy as np
import matplotlib.pyplot as plt

img = cv2.imread('drawing.jpg')
rows, cols = img.shape[:2]

# 變換前的三個點
pts1 = np.float32([[50, 65], [150, 65], [210, 210]])
# 變換后的三個點
pts2 = np.float32([[50, 100], [150, 65], [100, 250]])

# 生成變換矩陣，維數：2*3
M = cv2.getAffineTransform(pts1, pts2)
dst = cv2.warpAffine(img, M, (cols, rows))

plt.subplot(121), plt.imshow(img), plt.title('input')
plt.subplot(122), plt.imshow(dst), plt.title('output')
plt.show()

運行結果：

其實平移、旋轉、縮放和翻轉等變換就是對應了不同的仿射變換矩陣，下面分別來看：

（1）平移

平移就是x和y方向上的直接移動，可以上下/左右移動，自由度為2，變換矩陣可以表示為：

# 平移圖片
import numpy as np

rows, cols = img.shape[:2]

# 定義平移矩陣，需要是numpy的float32類型
# x軸平移100，y軸平移50
M = np.float32([[1, 0, 100], [0, 1, 50]])
dst = cv2.warpAffine(img, M, (cols, rows))

cv2.imshow('shift', dst)
cv2.waitKey(0)

（1）通過比例進行縮放

import cv2 as cv
import numpy as np

# 圖片縮放
img = cv.imread('images/animal.jpg', flags=1)  # flags=1讀取為彩色，flags=0讀取為灰度
cv.imshow('i', img)
h, w, channel = img.shape  # 以行列形式存儲, 第幾行到第幾行為圖像高度
dst_h = int(h*0.5)
dst_w = int(w*0.5)
# 最近鄰域差值 雙線性插值 像素關系重采樣 立方差值
dst = cv.resize(img, (dst_w, dst_h))  # 默認雙線性差值
cv.imshow('img', dst)
cv.waitKey(0)

OpenCV提供了resize函數來改變圖像的大小，C++中的函數原型如下：

void resize(InputArray src, OutputArray dst, Size dsize, double fx=0, double fy=0, int interpolation=INTER_LINEAR );

函數參數說明：

src：輸入，原圖像，即待改變大小的圖像；

dst：輸出，改變大小之后的圖像，這個圖像和原圖像具有相同的內容，只是大小和原圖像不一樣而已；

dsize：輸出圖像的大小。如果這個參數不為0，那么就代表將原圖像縮放到這個Size(width，height)指定的大小；如果這個參數為0，那么原圖像縮放之后的大小就要通過下面的公式來計算：

dsize = Size(round(fx*src.cols), round(fy*src.rows))

其中，fx和fy就是下面要說的兩個參數，是圖像width方向和height方向的縮放比例。

fx：width方向的縮放比例，如果它是0，那么它就會按照(double)dsize.width/src.cols來計算；

fy：height方向的縮放比例，如果它是0，那么它就會按照(double)dsize.height/src.rows來計算；

interpolation：這個是指定插值的方式，圖像縮放之后，肯定像素要進行重新計算的，就靠這個參數來指定重新計算像素的方式，有以下幾種：

INTER_NEAREST - 最鄰近插值
INTER_LINEAR - 雙線性插值，如果最后一個參數你不指定，默認使用這種方法
INTER_AREA - resampling using pixel area relation. It may be a preferred method for image decimation, as it gives moire’-free results. But when the image is zoomed, it is similar to the INTER_NEAREST method.
INTER_CUBIC - 4x4像素鄰域內的雙立方插值
INTER_LANCZOS4 - 8x8像素鄰域內的Lanczos插值

函數使用說明：

dsize和fx/fy不能同時為0，要么你就指定好dsize的值，讓fx和fy空置直接使用默認值，就像resize(img, imgDst, Size(30,30)); 要么你就讓dsize為0，指定好fx和fy的值，比如fx=fy=0.5，那么就相當於把原圖兩個方向縮小一倍！
至於最后的插值方法，正常情況下使用默認的雙線性插值就夠用了。幾種常用方法的效率是：最鄰近插值>雙線性插值>雙立方插值>Lanczos插值；但是效率和效果成反比，所以根據自己的情況酌情使用。
正常情況下，在使用之前dst圖像的大小和類型都是不知道的，類型從src圖像繼承而來，大小也是從原圖像根據參數計算出來。但是如果你事先已經指定好dst圖像的大小，那么你可以通過下面這種方式來調用函數：

resize(src, dst, dst.size(), 0, 0, interpolation);

（2）通過矩陣變換進行縮放　　

import cv2 as cv
import numpy as np

# 圖片縮放
img = cv.imread('../images/moon.jpg', flags=1)  # flags=1讀取為彩色，flags=0讀取為灰度
h, w = img.shape[:2]
mat_shift = np.float32([[0.5, 0, 0], [0, 0.5, 0]])  # 縮放矩陣
dst = cv.warpAffine(img, mat_shift, (int(w/2), int(h/2)))
cv.imshow('img1', img)
cv.imshow('img2', dst)
cv.waitKey(0)

免責聲明！

本站轉載的文章為個人學習借鑒使用，本站對版權不負任何法律責任。如果侵犯了您的隱私權益，請聯系本站郵箱yoyou2525@163.com刪除。

猜您在找 圖像幾何變換之透視變換計算機視覺之幾何變換（實現圖片縮放、剪切、移位、鏡像、仿射變換、旋轉等功能） python-opencv幾何變換--仿射變換、透視變換 OpenCV圖像變換(仿射變換與透視變換) opencv圖像的仿射變換與透視變換矩陣圖像幾何變換之仿射變換仿射變換與透視變換計算機視覺2D幾何基元及其變換介紹和OpenCV WarpPerspective源碼分析 OpenCV 之圖像幾何變換 OpenCV計算機視覺學習（3）——圖像灰度線性變換與非線性變換（對數變換，伽馬變換）