模板題:
給定$n = 2^k$和兩個序列$A_{0..n-1}$, $B_{0..n-1}$,求
$$C_i = \sum_{j \oplus k = i} A_j B_k$$
其中$\oplus$是某一滿足交換律的位運算,要求復雜度$O(nlogn)$。
快速沃爾什變換:
這是什么東西?能吃嗎?有用嗎? 請參閱SDOI2017r2d1-cut。
看到這個大家是不是立刻想到了快速傅里葉變換?
$$C_i = \sum_{j + k = i} A_j B_k$$
我們來想想離散傅里葉變換的本質。
$$\begin{aligned}& DFT(A)_i \\
&= A(\omega_n^i)\\
&=\sum_{j=0}^{n-1} A_j * (\omega_n^i)^j\end{aligned}$$
令$f(n, i, j) = (\omega_n^i)^j$,則
$$DFT(A)_i = \sum_{j=0}^{n-1} A_j f(n, i, j)$$
它要滿足$DFT(A)_i * DFT(B)_i = DFT(C)_i$,即
$$(\sum_{j=0}^{n-1} A_j f(n, i, j))(\sum_{k=0}^{n-1} B_k f(n, i, k))=\sum_{l=0}^{n-1} C_l f(n, i, l)$$
$$\sum_{j=0}^{n-1} \sum_{k=0}^{n-1} A_j B_k f(n, i, j) f(n, i, k))=\sum_{l=0}^{n-1} (\sum_{a+b=l} A_a B_b) f(n, i, l)$$
這時我們發現左右分別有$n^2$項,令對應項系數相等,得
$$f(n, i, j)f(n, i, k) = f(n, i, j + k)$$
只要任意一個可以進行逆變換且滿足上述條件的$f$都可以。
現在我們把上面的$+$都改成$\oplus$,就是離散沃爾什變換即
$$DWT(A)_i = \sum_{j=0}^{n-1} A_j f(n, i, j)$$
$$f(n, i, j)f(n, i, k) = f(n, i, j \oplus k)$$
怎么樣,是不是雲里霧里頓開茅塞?
然而我們還需要變快,所以快速傅里葉變換采用
$$f(n, i, j) = (\omega_n^i)^j$$
那它有什么優美的性質呢?
我們發現, 由於有折半引理,$f(n, i, j)$和$f(n, i+n/2, j)$可以同時從$f(n/2,i,j)$得來。
那么,從感性的角度,既然$\oplus$是一個位運算,那么應該更容易找到一個跟位運算有關的$f$,這樣就自然有類似折半引理的東西使得我們可以做到上述事情。
例如,當$\oplus$是位與時,可以取$f(i, j) = [i \& j = i]$, 即$j$的二進制完全包含在$i$的二進制里時為1,否則為0。
當$\oplus$是位異或時, 可取$f(i, j) = (-1)^{count(i \& j)}$,其中$count(x)$表示$x$的二進制表示中1的個數。
逆變換:
逆變換看上去好難啊。。。
其實逆變換還是比較簡單的。因為既然$f$跟位運算有關,我就只需要考慮某一位就好了。
例如$\oplus$是位異或時我考慮$n=2,A=(a_0, a_1)$,
那么$DWT(A) = (da_0 = a_0 + a_1, da_1 = a_0 - a_1)$
我只需要解一個二元一次方程(把$da_0, da_1$作為常數, $a_0, a_1$作為變量)就可以解出$a_0, a_1$了。
沒了。
關於$f$函數的構造:
$f$函數怎么構造。。。和逆變換的方法差不多啊。。。只需要看$n=2$的情況就行(實際上一般就是$-1$的幾次冪,或者$0, 1, -1$)
如果記憶力好可以把所有都背下來,反正滿足交換律的位運算只有8個,其中還有2個是全一和全零。。。
把剩下六個列出來吧。。。(下列$f$函數均將第一個參數$n$省略, $[expr]$在布爾表達式$expr$為真時為1, 否則為0)
$\oplus$為位與: $f(i, j) = [j \& i = i]$.
$\oplus$為位或: $f(i, j) = [j \& i = j]$.
$\oplus$為位異或: $f(i, j) = (-1)^{count(i \& j)}$.
$\oplus$為位與非,位或非的時候把三個數組的下標都取反就對應位或和位與。
$\oplus$為同或時直接求位異或卷積再把$C$的下標取反就行了。
吐槽:
明明可以背代碼我偏要說這么多。。。
只是因為閑的慌。。。
當然是要幫助大家更好的理解FWT。
至於為什么要滿足交換律。。。我才不會告訴你我還沒有搞出不滿足怎么做。
有同學說FWT難以感性理解。。。我也不知道如何感性理解。。。
代碼嘛。。。直接拿FFT改一改就好了。。。

1 void FWT(int *P, int len) { 2 if (len == 1) return; 3 FWT(P, len / 2); 4 FWT(P + len / 2, len / 2); 5 for (int i = 0; i < len / 2; ++i) { 6 int t1 = P[i], t2 = P[i + len / 2]; 7 P[i] = t1 + t2; 8 P[i + len / 2] = t1 - t2; 9 } 10 } 11 void IFWT(int *P, int len) { 12 if (len == 1) return; 13 for (int i = 0; i < len / 2; ++i) { 14 int t1 = P[i], t2 = P[i + len / 2]; 15 P[i] = (t1 + t2) / 2; 16 P[i + len / 2] = (t1 - t2) / 2; 17 } 18 IFWT(P, len / 2); 19 IFWT(P + len / 2, len / 2); 20 }