傅里葉變換
參考資料
https://zhuanlan.zhihu.com/p/19763358
https://zhuanlan.zhihu.com/p/110026009
https://robots.ox.ac.uk/~az/lectures/ia/lect2.pdf
時域和頻域
音樂類比:波形圖是時域,樂譜(音符)是頻域
單個音符是一個正弦波,不同振幅不同相位的正弦波疊加,可以構成任意波形
也就是說,任何周期函數都可以由正弦波疊加而成
傅里葉級數的頻譜
我們用一系列正弦波疊加成矩形波
稱不同頻率的正弦波為頻率分量
特別地,0頻率(直線)被稱為直流分量,它只造成整體上下平移
它的頻域是這樣的
為什么?
從三維空間看這些正弦波,如下:
時域就是正面看,頻域就是側面看
傅里葉變換就是時域和頻域之間的轉換
傅里葉級數的相位譜
很多在時域不好做的操作,在頻域可以輕松做到
確定一條正弦波需要知道振幅、頻率和相位,從側面看保留了振幅(y軸)和頻率(x軸)信息
相位信息從哪來?
我們將離頻率軸最近的波峰標記一個紅點,再投影到下平面上,就得到了相位譜
傅里葉變換
終於到了傅里葉變換部分
我們要通過它,將時域的連續信號轉化為頻域的連續信號
區別於傅里葉級數,它將時域的連續信號轉化成頻域的離散信號
離散信號足夠密集,就類似連續信號了
也就從求和符號變成積分符號了


歐拉公式
乘以\(i\)可以看成旋轉90°(參考三藍一棕)
從復平面法向量方向拉一條時間軸,用\(t\)替換\(x\),那么\(e^{it}\)可以看成一條螺旋線
指數形式的傅里葉變換
由上圖,正弦波的疊加,可以看成螺旋線的疊加在實數空間的投影
振幅——旋轉半徑
頻率——旋轉周期
相位——位置

最終結果是這樣的

一維公式
時域信號f(t)的傅里葉變換為
理解:對每個t,求\(f(t)\)和\(e^{-j\omega t}\)的內積,再求和,即\(f(t)\)在正弦波\(e^{-j\omega t}\)上的投影
反變換為
二維公式
將一個圖像分解成復平面波之和
同樣可以理解為:圖像與不同頻率不同方向的復平面波內積求和,即投影的過程
K空間
K空間即二維頻率域
確定一個二維正弦平面波需要四個參數:振幅、頻率、相位和方向向量
用復數存儲幅振幅和相位,用二維向量表示頻率和方向
(向量的方向為正弦波方向,向量的模長為頻率,向量終點存復數)
理解一下,越靠近中心原點,模長越小,頻率越小,對應低頻信息,提供主體信息
反之,越遠離中心,模長越大,頻率越大,對應高頻信息,提供細節信息
更好地理解了SOD里的結論:
high-level features help locate the salient objects roughly, low-level features help refine boundaries.
這些向量放到二維平面中,就是K-SPACE了

K空間的每個復數代表了復平面波在原圖像中占有多少成分,復系數乘以平面波相加就能得到原圖像

平面波是基,K空間的數是系數,疊加就是原信息
K空間里的相位保留位置信息,幅度保留強度信息
圖像旋轉,K空間也旋轉
Convolution Theorem
空間卷積=頻域乘積
類似FFT,要對兩個圖像卷積,先分別FT,再相乘,再IFT即可
Sampling Theorem
如果f(x,y)的傅里葉變換對頻率大於\(u_b\)和\(v_b\)的都為0
那么只要采樣距離\(w\le\dfrac{1}{2u_b}\),\(h\le\dfrac{1}{2v_b}\),原圖像就可以被完全恢復