uoj#272. 【清華集訓2016】石家庄的工人階級隊伍比較堅強（矩陣+三維FWT）

本文轉載自查看原文 2019-01-08 16:40 565 數論——矩陣/ 數論——集合——FWT

傳送門

題解

抄代碼$20$分鍾，搞懂題解在干嘛仨小時→_→

到今天才算真正搞明白$FWT$在干嗎了

本題

首先轉移關系都是恆定的，設它為一個矩陣$B$，那么要求的就是$f_n=f_0B^n$

定義三進制不退位減法$\ominus$，三進制不退位加法$\oplus$，這兩個互為逆運算（可以類比一下二進制的異或）

根據$B$矩陣的定義以及剪刀石頭布的性質易知$\forall k \lt 3^m,B_{i\oplus k,j\oplus k}=B_{i,j}$

那么易知$B_{i,j}=B_{i\ominus j,0}$。不難發現這個結論也可以推廣到$B^n$，即有$\forall k \lt 3^m,B^n_{i\oplus k,j\oplus k}=B^n_{i,j}$，可以用歸納法證，也可以感性理解一下

那么對於$f_n=f_0B^n$，它的第$i$項就為$$f_{n,i}=\sum_k f_{0,k}B^n_{k,i}=\sum_k f_{0,k}B^n_{0,i\ominus k}=\sum_{x\oplus y=i}f_{0,x}B^n_{0,y}$$
於是這玩意兒可以寫成一個卷積的形式

我們發現上面的式子只需要$B$的第一行就夠了，那么因為$$B^n_{0,i}=\sum_k B^n_{0,k}B_{k,i}=\sum_k B^n_{0,k}B_{0,i\ominus k}=\sum_{x\oplus y=i} B^n_{0,x}B_{0,y}$$
那么$B$的第一行做$n$次卷積，然后$f$再和它做一次卷積就是答案了

卷積

我們現在需要找到一個三進制不退位加法的卷積變換。據LargestJN大佬說，如果下標運算是模意義下加法，這個卷積就叫做循環卷積

然而就算它叫雞卷也沒用我們還是不會求

首先一個卷積就是要滿足$T(a)T(b)=T(a\oplus b)$（這里$\oplus$為任意運算），設$T$為這個卷積的矩陣，$x_{i,j}$為這個矩陣中的某個元素，那么上面的形式就可以表現為$$(\sum_{j=0}^{n-1}x_{i,j}a_j)(\sum_{k=0}^{n-1}x_{i,k}a_k)=\sum_{j=0}^{n-1}x_{i,j}\sum_{k\oplus t=j}a_kb_t$$
於是考慮$a_k$和$b_t$的貢獻，得有$$x_{i,k}x_{i,t}a_kb_t=x_{i,k\oplus t}a_k,b_t$$
那么就是對於$T$的每一行都得有$$x_{k}x_{t}=x_{k\oplus t}$$
於是$T$的每一行都是方程組$x_{k}x_{t}=x_{k\oplus t}$的一組解

然而只有卷積萬一沒有卷積的逆變換（管它叫雞卷好了）就gg了

所以我們的$T$還得有逆矩陣，那么根據線性代數的芝士，$T$的行列式不為$0$，那么方程組$x_{k}x_{t}=x_{k\oplus t}$至少要有$n$組不同的解

先來看看循環卷積的一般形式，長這樣$$A\times B=\sum_{i}\sum_{(j+k)mod \ n=i}A_jB_k$$
$T$滿足$x_ix_j=x_{(i+j)mod\ n}$

然后我們發現$n$次單位根$\omega^i$就是一組可行的解

不知道$n$次單位根的可以回去看看$FFT$的原理

然而需要$n$組解，於是矩陣長這樣

逆矩陣為$$\frac{1}{n} \begin{bmatrix}
1& 1 & 1& ... & 1\
1& w_n^{-1}& w_n^{-2}& ... & w_n^{-(n - 1)}\
1& w_n^{-2} & w_n^{-4}& ... & w_n^{-2(n- 1)}\
...& ...& ...& ...& ...\
1& w_n^{-(n - 1)}& w_n^{-2(n - 1)} & ... & w_n^{-(n - 1)(n - 1)}
\end{bmatrix}$$

回到本題

因為是三進制不進位加法，所以就選三次單位根$\omega$。這里可以把所有的復數都表示為$a+b\omega$的形式，那么因為三次單位根有$\omega^2+\omega+1=0$，所以有$\omega^2=-\omega-1$，所以所有的系數都是$0/1/-1$，運算過程中就不用取模了。兩個復數的乘法就是$$(a+b\omega)(c+d\omega)=ac+(ad+bc)\omega+bd(-\omega-1)=(ac-bd)+(ad+bc-bd)\omega$$
然后根據上面，$$T= \left[ \begin{matrix} 1 & 1 & 1 \ 1 & \omega & \omega^2 \ 1 & \omega^2 & \omega \end{matrix} \right]$$
以及我們知道$$\left[ \begin{matrix} 1 & 1 & 1 \ 1 & \omega & \omega^2 \ 1 & \omega^2 & \omega \end{matrix} \right]\times \left[ \begin{matrix} 1 & 1 & 1 \ 1 & \omega^2 & \omega \ 1 & \omega & \omega^2 \end{matrix} \right]=3E$$
其中$E$是單位矩陣

那么我們就可以把后面那個當做逆矩陣，帶進去算

因為$DFT$和$IDFT$本質都是分治做向量對矩陣的乘法，它$IDFT$的時候每一次都多乘了個$3$，總共有$\log_3 n$層，那么總共多乘了$3^{\log_3 n}=n$次，那么只要最后把所有元素都除以一個$n$就吼啦！

奇怪的模數問題……

最后是一個比較奇怪的模數問題，因為我們最后要除以$3^m$，要求$3^m$有逆元，也就是$3\nmid p$，然后因為它這個奇怪的模數$p$，假設$k=\frac{p}{3}$是個正整數，那么有$$\frac{1}{k + 1} + \frac{1}{k(k + 1)} = \frac{1}{k} = \frac{3}{p}$$
矛盾，於是$3\nmid p$

然后……就真的沒然后了……

//minamoto
#include<cstdio>
#include<cstring>
#include<map>
#define R register
#define fp(i,a,b) for(R int i=a,I=b+1;i<I;++i)
#define fd(i,a,b) for(R int i=a,I=b-1;i>I;--i)
#define go(u) for(int i=head[u],v=e[i].v;i;i=e[i].nx,v=e[i].v)
using namespace std;
char buf[1<<21],*p1=buf,*p2=buf;
inline char getc(){return p1==p2&&(p2=(p1=buf)+fread(buf,1,1<<21,stdin),p1==p2)?EOF:*p1++;}
int read(){
    R int res,f=1;R char ch;
    while((ch=getc())>'9'||ch<'0')(ch=='-')&&(f=-1);
    for(res=ch-'0';(ch=getc())>='0'&&ch<='9';res=res*10+ch-'0');
    return res*f;
}
char sr[1<<21],z[20];int C=-1,Z=0;
inline void Ot(){fwrite(sr,1,C+1,stdout),C=-1;}
void print(R int x){
    if(C>1<<20)Ot();if(x<0)sr[++C]='-',x=-x;
    while(z[++Z]=x%10+48,x/=10);
    while(sr[++C]=z[Z],--Z);sr[++C]='\n';
}
const int N=6e5+5;
int lim,m,P,t,b[25][25],a[N],inv2,invn;
inline int add(R int x){return x>=P?x-P:x;}
inline int dec(R int x){return x<0?x+P:x;}
inline int mul(R int x,R int y){return 1ll*x*y-1ll*x*y/P*P;}
void exgcd(int &x,int &y,int a,int b){
	if(!b)return (void)(x=1,y=0);
	exgcd(y,x,b,a%b),y-=a/b*x;
}
inline int inv(int a){
	int x,y;exgcd(x,y,a,P);
	return (x%P+P)%P;
}
struct complex{
	int x,y;
	complex(int X=0,int Y=0):x(X),y(Y){}
	inline complex operator +(const complex &b){return complex(add(x+b.x),add(y+b.y));}
	inline complex operator -(const complex &b){return complex(dec(x-b.x),dec(y-b.y));}
	inline complex operator *(const complex &b){
		return complex(dec(mul(x,b.x)-mul(y,b.y)),dec(add(mul(x,b.y)+mul(y,b.x))-mul(y,b.y)));
	}
	inline bool operator <(const complex &b)const{
		return x==b.x?y<b.y:x<b.x;
	}
}f[N],g[N];map<complex,complex>mp;
complex ksm(complex x,R int y){
	complex res(1,0);
	for(;y;y>>=1,x=x*x)if(y&1)res=res*x;
	return res;
}
complex calc1(complex b){return complex(dec(-b.y),dec(b.x-b.y));}
complex calc2(complex b){return complex(dec(b.y-b.x),dec(-b.x));}
void DFT(complex *A){
	for(R int mid=1;mid<lim;mid*=3)
		for(R int j=0;j<lim;j+=mid*3)
			for(R int k=0;k<mid;++k){
				complex x=A[j+k],y=A[j+k+mid],z=A[j+k+(mid<<1)];
				A[j+k]=x+y+z;
				A[j+k+mid]=x+calc1(y)+calc2(z);
				A[j+k+(mid<<1)]=x+calc2(y)+calc1(z);
			}
}
void IDFT(complex *A){
	for(R int mid=1;mid<lim;mid*=3)
		for(R int j=0;j<lim;j+=mid*3)
			for(R int k=0;k<mid;++k){
				complex x=A[j+k],y=A[j+k+mid],z=A[j+k+(mid<<1)];
				A[j+k]=x+y+z;
				A[j+k+mid]=x+calc2(y)+calc1(z);
				A[j+k+(mid<<1)]=x+calc1(y)+calc2(z);
			}
	for(R int i=0;i<lim;++i)A[i].x=mul(A[i].x,invn);
}
int main(){
//	freopen("testdata.in","r",stdin);
	m=read(),t=read(),P=read();
	lim=1;fp(i,1,m)lim*=3;
	if(P==1){
		fp(i,0,lim-1)print(0);
		return Ot(),0;
	}
	fp(i,0,lim-1)a[i]=read();
	fp(i,0,m)fp(j,0,m-i)b[i][j]=read();
	fp(i,0,lim-1){
		int tmp=i,cntw=0,cntl=0;
		while(tmp){
			int k=tmp%3;
			k==1?++cntw:k==2?++cntl:0;
			tmp/=3;
		}g[i]=b[cntw][cntl],f[i]=a[i];
	}
	inv2=inv(2),invn=inv(lim);
	DFT(f),DFT(g);
	fp(i,0,lim-1)f[i]=f[i]*(mp.count(g[i])?mp[g[i]]:(mp[g[i]]=ksm(g[i],t)));
	IDFT(f);
	fp(i,0,lim-1)print(f[i].x);
	return Ot(),0;
}

免責聲明！

本站轉載的文章為個人學習借鑒使用，本站對版權不負任何法律責任。如果侵犯了您的隱私權益，請聯系本站郵箱yoyou2525@163.com刪除。

猜您在找 2022石家庄市質檢游記 BZOJ4732. [清華集訓2016]數據交互（樹鏈剖分＋線段樹＋multiset）三維坐標變換矩陣的推導過程三維坐標旋轉矩陣項目部對分包隊伍管理的原則和重點干部帶隊伍的四個知道，一個跟上技術管理之路三、團隊建設：怎么帶隊伍？高維FWT 三維坐標系的旋轉矩陣 UOJ #221 【NOI2016】循環之美