從泊松方程的解法，聊到泊松圖像融合

本文轉載自查看原文 2019-12-20 17:13 758 18.opencv

從泊松方程的解法，聊到泊松圖像融合

字節跳動算法工程師

2004 年 SIGGRAPH 上，Microsoft Research UK 有篇經典的圖像融合文章《Poisson Image Editing》。先看看其驚人的融合結果（非論文配圖，本人實驗結果）：

這篇文章的實現，無關目前算法領域大火的神經網絡，而是基於泊松方程推導得出。

泊松方程是什么？

很多朋友比較熟悉概率論里面的泊松分布。泊松方程，也是同一個數學家泊松發明的。但卻和泊松分布沒有什么關系，是泊松物理學領域提出的一個偏微分方程。

$\Delta f=\Omega$

這里 $\Delta$ 表示的是拉普拉斯算子， $f$ 和 $\Omega$ （ $\Omega$ 在泊松方程中是已知量）可以是實數或復數值方程，特殊情況當 $\Delta f=0$ 時被稱為拉普拉斯方程。當處於歐幾里得空間時，拉普拉斯算子通常表示為 $\nabla^2$ 。

學習圖像處理的朋友對於 $\Delta$ 和 $\nabla$ 比較熟悉，分別表示二階微分（直角坐標系下的散度）、一階微分（直角坐標系下的梯度）。

微分與卷積

連續空間中的微分計算，就是大學里微積分那一套公式。但是在計算機的世界里，數據都是在離散空間中進行表示，對於圖像而言，基本的計算單元就是像素點。讓我們從最簡單的情形，一維數組的微分說起：

$\nabla$ 表示位置 $x$ 一階微分計算（一階中心導）： $\frac{df(x)}{dx}=\frac{f(x+h)-f(x-h)}{2h}$

$\Delta$ 表示位置 $x$ 二階微分計算（二階中心導）： $\frac{d^2f(x)}{dx^2}=\frac{f(x+h)-2f(x)+f(x-h)}{h^2}$

隨着 $h \rightarrow 0$ ，上面的微分算式的結果會逐漸逼近真實的微分值。對於圖像而言，這里 $h$ 最小可分割單元是像素，也就表示像素間的間距，可視為 $1$ 。再看看，二階微分的公式，是不是可以看成 $1\times3$ 的卷積核 $[1,-2,1]$ 在一維數組上進行卷積計算的結果（卷積中心在 $x$ 上）。

至此，不難理解，離散數據（例如圖像）上的微分操作完全可以轉換為卷積操作。

當數組維度更高，變成二維數組呢？也就是處理圖像的拉普拉斯算子： $\Delta =\frac{\partial^2}{\partial x^2}+\frac{\partial^2}{\partial y^2}$

此時，卷積核尺寸應該是 $3\times3$ ，具體數值為 $\begin{bmatrix} 0 & 1 & 0 \\ 1 & -4 & 1 \\ 0 & 1 & 0 \end{bmatrix}$ ，稱為拉普拉斯卷積核。

記住拉普拉斯卷積核，我們后面會用到。

泊松方程求解

這個時候，想想我們學會了什么？泊松方程的形式，以及拉普拉斯卷積核。

再想想，在圖像場景下，什么是泊松方程的核心問題？

已知圖像點二階微分值（直角坐標系下即散度 ${\rm div}$ ）的情況下，求解各個圖像點的像素值。

一個簡單的例子，假設有一張 $4\times4$ 的圖像 $X$ ： $\begin{bmatrix} x_1 & x_2 & x_3 & x_4 \\ x_5 & x_6 & x_7 & x_8 \\ x_9 & x_{10} & x_{11} & x_{12} \\ x_{13} & x_{14} & x_{15} & x_{16} \end{bmatrix}$ ， $x_i$ 表示各個位置上的圖像像素值，共 16 個未知參數需要被求解。

應用拉普拉斯卷積核后，得到 4 個方程式： $\begin{equation} \left\{ \begin{array}{**lr**} x_2+x_5+x_7+x_{10}-4 x_6={\rm div} x_6& \\ x_3+x_6+x_8+x_{11}-4 x_7={\rm div} x_7&\\ x_6+x_9+x_{11}+x_{14}-4 x_{10}={\rm div} x_{10}&\\ x_7+x_{10}+x_{12}+x_{15}-4 x_{11}={\rm div} x_{11}& \end{array} \right. \end{equation}$

4 個方程式求解出 16 個未知參數？這是不可能的。

因此，我們需要另加入至少 12 個更多的方程式，也就是說，需要把剩余 12 個邊界點的值確定，即需要確定邊界條件。邊界一般符合 2 種常見的邊界條件：

Neumann 邊界，譯為紐曼邊界或黎曼邊界，給出函數在邊界處的二階導數值；
Dirichlet 邊界，狄利克雷邊界，給出邊界處函數在邊界處的實際值。

但給定邊界條件之后，就可以有 16 個方程式組成的方程組了，矩陣化表示此方程組之后，得到形式為 $A\textbf{x}=b$ 。

看到 $A\textbf{x}=b$ ，大家就應該放松了，不就是解方程嘛，用雅可比迭代法或者高斯賽德爾迭代法來求解就 OK 了。

Poisson Image Editing

背景知識儲備好了后，讓我們把目光拉回到論文《Poisson Image Editing》上。

在圖像融合任務中，前景放置在背景上時，需要保證兩點：

前景本身主要內容相比於背景而言，盡量平滑；
邊界處無縫，即前景、背景在邊界點位置上的像素值，需要保持邊界一致。

重點關注兩個詞：內容平滑、邊界一致。平滑是什么？可以理解成圖像前景、背景梯度相同。邊界一致是指什么？可以理解成在邊界上像素值相同。再用一張圖來說明：

藍色圖片表示前景圖片，需要被融合到肉色的背景圖片上

上圖中 $u$ 表示需要被合成的前景圖片， $V$ 是 $u$ 的梯度場。 $S$ 是背景圖片， $\Omega$ 是合並后目標圖像中被前景所覆蓋的區域，則 $\partial \Omega$ 是 $\Omega$ 的邊界。設合並后圖像在 $\Omega$ 內的像素表示函數是 $f$ ，在 $\Omega$ 外的像素值表示函數是 $f^{*}$ 。

此時，平滑可表示為： $\begin{equation} \min_{\substack{f}} \iint_{\Omega}\left| \nabla f-\textbf{v} \right|^2 \end{equation}$ ；保持邊界一致可表示為： $f|_{\partial \Omega}=f^{*}|_{\partial \Omega}$ 。

這里如果接觸過泛函的朋友會比較開心，沒接觸過的朋友可以先看看歐拉-拉格朗日方程。

令 $F=\left| \nabla f-\textbf{v} \right|^2=(\nabla f_x-\textbf{v}_x)^2+(\nabla f_y-\textbf{v}_y)^2$ ，

代入歐拉-拉格朗日方程后則有： $\frac{\partial F}{\partial f}=\frac{d}{dx}\left[ \frac{\partial F}{\partial (\nabla f_x-\textbf{v}_x)^2} \right]+\frac{d}{dy}\left[ \frac{\partial F}{\partial (\nabla f_y-\textbf{v}_y)^2} \right]$

$\Rightarrow0=\frac{d}{dx}\left[ 2 (\nabla f_x-\textbf{v}_x) \right]+\frac{d}{dy}\left[ 2 ( f_y-\textbf{v}_y) \right]$

注意： $F$ 是 $\nabla f$ 的函數，不是對 $f$ 的，因此 $\frac{\partial F}{\partial f}=0$

$\Rightarrow0=(\frac{\partial^2 f}{\partial x^2}-\frac{\partial \textbf{v}}{\partial x})+(\frac{\partial^2 f}{\partial y^2}-\frac{\partial \textbf{v}}{\partial y})\Rightarrow \Delta f=\textbf{div v}$

怎么樣，看起來是不是一個泊松方程呢？當然，還差兩步：

因為需要平滑， $\textbf{div v}$ 取值需要同時參考前景圖片和背景圖片，可以直接等於前景像素的散度，也可以在前景和背景在同一點像素的散度進行某種組合得到（論文中在 Selection cloning 和 Selection editing 章節有討論各自合適的場景，但個人以為這里采取學習的方法應該更魯棒，而不是用固定的策略來區分）。anyway， $\textbf{div v}$ 是可以計算的已知量；
因為需要保持邊界一致，邊界條件上像素值等於背景圖片即可。當然也可以做一些策略，但同樣也可以計算得到的已知量。

現在很輕松了，邊界條件已知、散度已知，在離散空間中求解泊松方程中的 $f$ ，參考上一節的求解過程即可。

代碼實現

函數代碼已經收錄在了 OpenCV 的官方函數 seamlessClone 里：github source code

使用的時候，需要三張圖片：前景圖、背景圖、mask圖（指明前景圖中需要融合的區域，最簡單的就是直接等於前景圖大小的 mask，待融合區域是白色，其余位置黑色）。

下面我們使用 OpenCV 的 Python 接口來動手試試，用到以下兩張圖以及一段代碼：

foreground.jpg

background.jpg

import cv2 import numpy as np # Read images : src image will be cloned into dst dst = cv2.imread("background.jpg") obj= cv2.imread("foreground.jpg") # Create an all white mask mask = 255 * np.ones(obj.shape, obj.dtype) # The location of the center of the src in the dst width, height, channels = dst.shape center = (height/2, width/2) # Seamlessly clone src into dst and put the results in output normal_clone = cv2.seamlessClone(obj, dst, mask, center, cv2.NORMAL_CLONE) mixed_clone = cv2.seamlessClone(obj, dst, mask, center, cv2.MIXED_CLONE) # Write results cv2.imwrite("images/opencv-normal-clone-example.jpg", normal_clone) cv2.imwrite("images/opencv-mixed-clone-example.jpg", mixed_clone)

最終效果如下：

編輯於 2019-06-21

免責聲明！

本站轉載的文章為個人學習借鑒使用，本站對版權不負任何法律責任。如果侵犯了您的隱私權益，請聯系本站郵箱yoyou2525@163.com刪除。

猜您在找 泊松方程解法圖像的泊松(Poisson)編輯、泊松融合圖像融合之泊松融合（Possion Matting）泊松融合梯度泊松方程網格形變泊松分布、泊松過程、泊松點過程泊松分布與泊松回歸模型泊松分布泊松分布 Poisson Distribution——泊松分布