SAM 做题笔记（各种技巧，持续更新，SA）

本文转载自查看原文 2021-02-23 21:33 376 笔记/ 纸糊船

SAM 感性瞎扯。

这里是 SAM 做题笔记。

~~本来是在一篇随笔里面，然后 Latex 太多加载不过来就分成了两篇。~~

标 * 的是推荐一做的题目。

trick 是我总结的技巧。

I. P3804 【模板】后缀自动机 (SAM)

题意简述：求一个字符串 \(s\) 的所有子串长度乘上其出现次数的最大值。

代码还没写过，到时候来补一下。

update：尝试只看自己的博客写出代码，然而失败了 >.<

update：好家伙，第二次跳 \(p\) 的时候（即把 \((p_i,q)\) 变为 \((p_i,q')\) 的时候）忘记跳了（即 \(p\gets \mathrm{link}(p)\)），并且连边的 vector 开小了（应该开 \(2\times 10^6\)）。

额外信息：设在构造 SAM 时，每个前缀所表示的状态（也就是每次的 \(cur\)）为终点节点。这样我们可以得到 \(n\) 个终点节点。

结论 4：在 \(\mathrm{link}\) 树上，每个节点的 \(\mathrm{endpos}\) 集合等于其子树内所有终点节点对应的终点的集合。感性理解，证明略。（之前的结论可以看 SAM 感性瞎扯）
- 将状态 \(p\) 所表示的 \(\mathrm{endpos}\) 集合大小记为 \(ed_p\)。

对于一个状态 \(p\)，我们怎么求它所代表的子串在 \(s\) 中的出现次数呢？其实很简单，根据定义，我们只需求出该状态 \(\mathrm{endpos}\) 集合的大小即可。根据结论 4，即在 \(\mathrm{link}\) 树上 \(p\) 的子树所包含的终点节点个数。这样，我们可以在构造 SAM 时顺便记录一下每个点是否是终点节点。构造完成后我们建出 \(\mathrm{link}\) 树，并通过一次 dfs 求出每个点的 \(\mathrm{endpos}\) 集合大小。那么答案为

\[\max_i \mathrm{len}(i)\times |\mathrm{endpos(longest}(i))| \]

代码奉上，手捏的 SAM 版本（doge）：

SAM version 1.0

const int N=1e6+5;
struct node{
	int nxt[26],len,link,ed;
}sam[N<<1];
int cur,cnt;
void init(){
	sam[0].link=-1;
}
void ins(char s){
	int las=cur,p=las,it=s-'a'; sam[cur=++cnt].ed=1; // cur 是终点节点
	sam[cur].len=sam[las].len+1; // init
	while(~p&&!sam[p].nxt[it])sam[p].nxt[it]=cur,p=sam[p].link; // jump link
	if(p==-1)return; // case 1
	int q=sam[p].nxt[it];
	if(sam[p].len+1==sam[q].len){ // case 2
		sam[cur].link=q;
		return;
	} int cl=sam[cur].link=++cnt; // case 3 : clone
	sam[cl].len=sam[p].len+1;
	sam[cl].link=sam[q].link;
	for(int i=0;i<26;i++)sam[cl].nxt[i]=sam[q].nxt[i];
	sam[q].link=cl;
	while(~p&&sam[p].nxt[it]==q)sam[p].nxt[it]=cl,p=sam[p].link;
}
vector <int> e[N<<1];
ll ans;
void dfs(int id){
	for(int it:e[id])dfs(it),sam[id].ed+=sam[it].ed;
	if(sam[id].ed>1)ans=max(ans,1ll*sam[id].len*sam[id].ed);
}

char s[N];
int n;
int main(){
	scanf("%s",s+1),n=strlen(s+1),init();
	for(int i=1;i<=n;i++)ins(s[i]);
	for(int i=1;i<=cnt;i++)e[sam[i].link].pb(i);
	dfs(0),cout<<ans<<endl;
	return 0;
}

当然，用结构体来表示一个节点的信息有时太过麻烦，所以当需要储存的信息不多时，我们可以直接用数组储存。下面是简化过的版本。

SAM version 1.1

const int N=2e6+5;
const int S=26;

int cur,cnt;
int son[N][S],fa[N],len[N],ed[N];
void ins(char s){
	int las=cur,p=cur,it=s-'a';
	ed[cur=++cnt]=1,len[cur]=len[las]+1;
	while(~p&&!son[p][it])son[p][it]=cur,p=fa[p];
	if(p==-1)return;
	int q=son[p][it];
	if(len[p]+1==len[q]){
		fa[cur]=q;
		return;
	} int c=fa[cur]=++cnt;
	len[c]=len[p]+1,fa[c]=fa[q],fa[q]=c;
	for(int i=0;i<26;i++)son[c][i]=son[q][i];
	while(~p&&son[p][it]==q)son[p][it]=c,p=fa[p];
}
void build(char *s){
	int n=strlen(s+1); fa[0]=-1;
	for(int i=1;i<=n;i++)ins(s[i]);
}
vector <int> e[N<<1];
ll ans;
void dfs(int id){
	for(int it:e[id])dfs(it),ed[id]+=ed[it];
	if(ed[id]>1)ans=max(ans,1ll*len[id]*ed[id]);
}

char s[N];
int n;
int main(){
	scanf("%s",s+1),build(s);
	for(int i=1;i<=cnt;i++)e[fa[i]].pb(i);
	dfs(0),cout<<ans<<endl;
	return 0;
}

~~这难道不更好看么？~~

II. P3975 [TJOI2015]弦论

给出 \(s,t,k\)，求 \(s\) 字典序第 \(k\) 小子串，不存在输出 \(\texttt{-1}\)。\(t=0\) 表示不同位置的相同子串算一个，\(t=1\) 表示不同位置的相同子串算多个。

算是一道经典题了。

根据结论 2，可知 \(s\) 不同子串的个数等于从 \(T\) 出发的不同路径的条数，且每一条路径对应一个子串。设 \(d_p\) 表示从状态 \(i\) 开始的路径数量（包括长度为 \(0\) 的数量），可以通过拓扑排序 + DP 计算，即

\[d_p=1+\sum_{(p,q)\in\mathrm{SAM}}d_q \]

如果 \(t=0\)，那么我们要找的就是 SAM 中从 \(T\) 开始的字典序第 \(k\) 小的路径，这可以通过贪心轻松实现。如果 \(t=1\)，那么将上述转移式中的 \(1\) 修改为 \(ed_p\) 即可。代码如下：

Luogu P3975 代码

/*
	Powered by C++11.
	Author : Alex_Wei.
*/

#include <bits/stdc++.h>
using namespace std;


const int N=1e6+5;
const int S=26;

// Suffix_Automaton
int cur,cnt;
int son[N][S],f[N],len[N],ed[N];
int deg[N],val[N];
vector <int> le[N],se[N];
void ins(char s){
	int las=cur,p=cur,it=s-'a';
	ed[cur=++cnt]=1,len[cur]=len[las]+1;
	while(p&&!son[p][it])son[p][it]=cur,p=f[p];
	if(p==0){
		f[cur]=1;
		return;
	} int q=son[p][it];
	if(len[p]+1==len[q]){
		f[cur]=q;
		return;
	} int c=++cnt;
	f[c]=f[q],f[q]=f[cur]=c,len[c]=len[p]+1;
	for(int i=0;i<26;i++)son[c][i]=son[q][i];
	while(p&&son[p][it]==q)son[p][it]=c,p=f[p];
} void build(char *s){
	int n=strlen(s+1); cnt=cur=1;
	for(int i=1;i<=n;i++)ins(s[i]);
	for(int i=1;i<=cnt;i++){
		le[f[i]].emplace_back(i);
		for(int j=0;j<26;j++)if(son[i][j])
			se[son[i][j]].emplace_back(i),deg[i]++; 
	}
}

void dfs(int id){
	for(int it:le[id])dfs(it),ed[id]+=ed[it];
}

char s[N],ans[N];
int t,k;
void find1(int p,int l){
	for(int i=0;i<26;i++){
		if(!son[p][i])continue;
		if(k>val[son[p][i]])k-=val[son[p][i]];
		else if(k>(t?ed[son[p][i]]:1)){
			k-=(t?ed[son[p][i]]:1),ans[l]=i+'a';
			find1(son[p][i],l+1);
			return;
		} else{
			ans[l]=i+'a',cout<<ans<<endl;
			return;
		}
	}
}

int main(){
	scanf("%s",s+1),build(s);
	cin>>t>>k; dfs(1);
	queue <int> q;
	for(int i=1;i<=cnt;i++)if(!deg[i])q.push(i);
	while(!q.empty()){
		int tt=q.front(); q.pop();
		val[tt]+=(t?ed[tt]:1);
		for(int it:se[tt]){
			val[it]+=val[tt];
			if(!--deg[it])q.push(it);
		}
	}
	if(val[1]<k)puts("-1");
	else find1(1,0);
	return 0;
}
/*
aabcd
1 15
*/

然后你会发现它竟然 TLE 了！太离谱了！！！！111

经过不断地调试之后我发现 vector 连边耗时竟然这么大（大概 800ms，就离谱），可是不用 vector 连边就要写非常麻烦的链式前向星，巨麻烦无比，否则没法求出来 \(ed\) 和 \(d\)，怎么办？逛了一圈题解区，有一个特别 nb 的技巧：

trick 1：将编号按照 \(\mathrm{len}(i)\) 降序排序，得到的就是 SAM DAG 反图的拓扑序，这样直接循环更新 \(ed\) 和 \(d\) 就可以了。可是这样会破坏 SAM \(\mathcal{O}(n)\) 的优秀时间复杂度~~（其实常数巨大，还没 SA 跑得快）~~，那么直接鸡基排就好了。

SAM version 2.0

/*
	Powered by C++11.
	Author : Alex_Wei.
*/

#include <bits/stdc++.h>
using namespace std;


const int N=1e6+5;
const int S=26;

// Suffix_Automaton
int cur,cnt;
int son[N][S],f[N],len[N],ed[N];
int val[N],id[N],buc[N];
void ins(char s){
	int las=cur,p=cur,it=s-'a';
	ed[cur=++cnt]=1,len[cur]=len[las]+1;
	while(p&&!son[p][it])son[p][it]=cur,p=f[p];
	if(p==0){
		f[cur]=1;
		return;
	} int q=son[p][it];
	if(len[p]+1==len[q]){
		f[cur]=q;
		return;
	} int c=++cnt;
	f[c]=f[q],f[q]=f[cur]=c,len[c]=len[p]+1;
	for(int i=0;i<26;i++)son[c][i]=son[q][i];
	while(p&&son[p][it]==q)son[p][it]=c,p=f[p];
} void build(char *s){
	int n=strlen(s+1); cnt=cur=1;
	for(int i=1;i<=n;i++)ins(s[i]);
	for(int i=1;i<=cnt;i++)buc[len[i]]++;
	for(int i=1;i<=cnt;i++)buc[i]+=buc[i-1];
	for(int i=cnt;i;i--)id[buc[len[i]]--]=i;
	for(int i=cnt;i;i--)ed[f[id[i]]]+=ed[id[i]];
}

char s[N],ans[N];
int t,k;
void find(int p,int l){
	for(int i=0;i<26;i++){
		if(!son[p][i])continue;
		if(k>val[son[p][i]])k-=val[son[p][i]];
		else if(k>(t?ed[son[p][i]]:1)){
			k-=(t?ed[son[p][i]]:1),ans[l]=i+'a';
			find(son[p][i],l+1);
			return;
		} else{
			ans[l]=i+'a',cout<<ans<<endl;
			return;
		}
	}
}

int main(){
	scanf("%s",s+1),build(s);
	cin>>t>>k;
	for(int i=cnt;i;i--){
		val[id[i]]=(t?ed[id[i]]:1);
		for(int j=0;j<26;j++)val[id[i]]+=val[son[id[i]][j]];
	}
	if(val[1]-ed[1]<k)puts("-1");
	else find(1,0);
	return 0;
}

III. P3763 [TJOI2017]DNA

题意简述：求 \(S\) 有多少个长度为 \(|S_0|\) 的子串满足与 \(S_0\) 至多有 \(3\) 个对应位置上的字符不等。（字符集为 \(\texttt{\{A,C,G,T\}}\)）

用 SAM 口胡一波。~~因为我是用 SA 写的（怎么混进了一个奇怪的东西）。~~

SAM 的话，一个想法是直接暴力 dfs，向四个方向都搜索一遍，如果转移方向字符与当前匹配的位置上的字符不同就计数器自增 \(1\) ，匹配完成就答案加上 \(ed_p\)（\(p\) 是匹配到的状态）即可。不过不会分析时间复杂度。

SA 的话直接用 \(height\) 数组的区间 RMQ 加速匹配，这样匹配就是 \(\mathcal{O}(n)\) 的。SA 又好想又好写，何乐而不为呢？

Luogu P3763 代码

/*
	Powered by C++11.
	Author : Alex_Wei.
*/

#include <bits/stdc++.h>
using namespace std;

#define mem(x,v) memset(x,v,sizeof(x))


const int N=2e5+5;
const int K=18;

// Suffix_Array
int n,sa[N],rk[N<<1],ht[N],ind[N];
int buc[N],px[N],id[N],ork[N<<1],mi[N][K];
char s[N];
void clear(){
	mem(sa,0),mem(rk,0),mem(ind,0),mem(buc,0),mem(mi,0);
}
bool cmp(int a,int b,int w){
	return ork[a]==ork[b]&&ork[a+w]==ork[b+w];
}
void build(){
	int m=1<<7,p=0;
	for(int i=1;i<=n;i++)buc[rk[i]=s[i]]++;
	for(int i=1;i<=m;i++)buc[i]+=buc[i-1];
	for(int i=n;i;i--)sa[buc[rk[i]]--]=i;
	for(int w=1;w<n;w<<=1,m=p,p=0){
		for(int i=n;i>n-w;i--)id[++p]=i;
		for(int i=1;i<=n;i++)if(sa[i]>w)id[++p]=sa[i]-w;
		for(int i=0;i<=m;i++)buc[i]=0;
		for(int i=1;i<=n;i++)buc[px[i]=rk[id[i]]]++;
		for(int i=1;i<=m;i++)buc[i]+=buc[i-1];
		for(int i=n;i;i--)sa[buc[px[i]]--]=id[i];
		memcpy(ork,rk,sizeof(rk)),p=0;
		for(int i=1;i<=n;i++)rk[sa[i]]=cmp(sa[i],sa[i-1],w)?p:++p;
		if(p==n)break; 
	}
	for(int i=1,k=0;i<=n;i++){
		if(k)k--;
		while(s[i+k]==s[sa[rk[i]-1]+k])k++;
		ht[rk[i]]=k;
	}
	for(int j=0;j<K;j++)
		for(int i=1;i+(j?1<<j-1:0)<=n;i++)
			mi[i][j]=(j==0?ht[i]:min(mi[i][j-1],mi[i+(1<<j-1)][j-1]));
}
int gmin(int l,int r){
	if(l>r)swap(l,r);
	int d=log2(r-l);
	return min(mi[l+1][d],mi[r-(1<<d)+1][d]);
}

int t,ans;
int main(){
	cin>>t;
	while(t--){
		clear(),ans=0,scanf("%s",s+1);
		int l=strlen(s+1);
		for(int i=1;i<=l;i++)ind[i]=1;
		scanf("%s",s+l+2),s[l+1]=127,n=strlen(s+1);
		for(int i=l+2;i<=n;i++)ind[i]=2;
		build();
		for(int i=1;i<=n;i++){
			if(ind[sa[i]]==1&&sa[i]+(n-l-1)-1<=l){
				int p=l+2,id=sa[i];
				for(int k=0;k<4;k++){
					int d=gmin(rk[id],rk[p]);
					id+=d+(k<3),p+=d+(k<3);
					if(p>=n+1)break;
				} ans+=p>=n+1;
			}
		}
		cout<<ans<<endl;
	}
	return 0;
}

IV. P4070 [SDOI2016]生成魔咒

求 \(s\) 的每一个前缀的本质不同子串个数。

这题一看就很 SAM。~~然而我就是要用 SA 做！！！！1111！！！然后成功 WA 掉。~~

一开始的想法是直接正着做，然后维护一下所有相邻后缀的 \(height\)（统计有多少 \(lcp\) 是因为后面被截掉而没有计算完的，每次向右移动就要减去这些 \(lcp\) 的数量，直到其中的 \(lcp\) 到了相应的位置）。然而，\(s[1:i]\) 后缀排序后所有后缀排名的相对位置，在 \(s[1:n]\) 中可能会改变。一个例子是 \(s=[1,1,2,1,2]\)，那么 \(s[1:4]\) 时 \(s_4\) 排在 \(s_1\) 前面，而 \(s[1:5]\) 时 \(s_4\) 排在 \(s_1\) 的后面。这样就悲催了。看了题解后发现了~~新大陆~~一个小技巧：

trick 2：将 \(s\) 翻转后，从后往前添加后缀。这样可以避免在末尾添加字符时导致所有后缀原有的顺序改变，而翻转不会影响到一个字符串的本质不同子串个数。

这样就做完了。~~又是用 SA 水 SAM 题目的一天。~~

Luogu P4070 代码

/*
	Powered by C++11.
	Author : Alex_Wei.
*/

#include <bits/stdc++.h>
using namespace std;

#define se second
#define ll long long

const int N=1e5+5;
const int K=17;

// Suffix_Array
int n,sa[N],rk[N<<1],ht[N],s[N];
map <int,int> buc;
int px[N],id[N],ork[N<<1],mi[N][K];
bool cmp(int a,int b,int w){
	return ork[a]==ork[b]&&ork[a+w]==ork[b+w];
}
void build(){
	int p=0;
	for(int i=1;i<=n;i++)buc[rk[i]=s[i]]++;
	for(auto it=++buc.begin(),pre=buc.begin();it!=buc.end();it++,pre++)(*it).se+=(*pre).se;
	for(int i=n;i;i--)sa[buc[rk[i]]--]=i;
	for(int w=1;w<n;w<<=1,p=0){
		for(int i=n;i>n-w;i--)id[++p]=i;
		for(int i=1;i<=n;i++)if(sa[i]>w)id[++p]=sa[i]-w;
		buc.clear(); for(int i=1;i<=n;i++)buc[px[i]=rk[id[i]]]++;
		for(auto it=++buc.begin(),pre=buc.begin();it!=buc.end();it++,pre++)(*it).se+=(*pre).se;
		for(int i=n;i;i--)sa[buc[px[i]]--]=id[i];
		memcpy(ork,rk,sizeof(rk)),p=0;
		for(int i=1;i<=n;i++)rk[sa[i]]=cmp(sa[i],sa[i-1],w)?p:++p;
		if(p==n)break; 
	}
	for(int i=1,k=0;i<=n;i++){
		if(k)k--;
		while(s[i+k]==s[sa[rk[i]-1]+k])k++;
		ht[rk[i]]=k;
	}
	for(int j=0;j<K;j++)
		for(int i=1;i+(j?1<<j-1:0)<=n;i++)
			mi[i][j]=(j==0?ht[i]:min(mi[i][j-1],mi[i+(1<<j-1)][j-1]));
}
int lcp(int l,int r){
	int d=log2(r-l);
	return min(mi[l+1][d],mi[r-(1<<d)+1][d]);
}

ll cur;
set <int> st;
int main(){
	cin>>n;
	for(int i=1;i<=n;i++)cin>>s[i];
	reverse(s+1,s+n+1);
	build(),st.insert(rk[n]);
	cout<<1<<endl;
	for(int i=n-1;i;i--){
		st.insert(rk[i]);
		auto it=st.lower_bound(rk[i]);
		if(it!=st.begin()&&it!=--st.end()){
			auto pre=--it,suf=++++it;
			cur+=-lcp(*pre,*suf)+lcp(*pre,rk[i])+lcp(rk[i],*suf);
		} else if(it!=st.begin()){
			auto pre=--it;
			cur+=lcp(*pre,rk[i]);
		} else{
			auto suf=++it;
			cur+=lcp(rk[i],*suf);
		} cout<<1ll*(n-i+1)*(n-i+2)/2-cur<<endl;
	}
	return 0;
}

SAM 的话直接 \(ans\gets ans+\mathrm{len}(cur)-\mathrm{len}(\mathrm{link}(cur))\) 就好了。

*V. CF1037H Security

题意简述：给出 \(s,q\)，\(q\) 次询问每次给出 \(l,r,t\)，求字典序最小的 \(s[l:r]\) 的子串 \(s'\) 使得 \(s'>t\)。

~~神仙题，又让我学会了一个神奇的操作（其实是我菜没见过套路）。~~

就是对于这种区间子串的题目，我们直接在 SAM 上贪心的时候，不知道当前的选择是否可行（即选一个字符后判断可不可能当前选取的整个字符串落在区间 \([l,r]\) 里面），那么可以……

trick 3：用线段树合并维护 \(\mathrm{endpos}\) 集合。

如果有了 \(\mathrm{endpos}\) 集合，直接贪心选取就好了。注意要贪到第 \(|T|+1\) 位（因为可能当前 \(s'=t\)，那么再选一个字符就好了）。

~~为了写这道题目甚至去学了一下线段树合并。~~

CF1037H 代码

/*
	Powered by C++11.
	Author : Alex_Wei.
*/

#include <bits/stdc++.h>
using namespace std;

//#pragma GCC optimize(3)

//using int = long long
//using i128 = __int128;

using uint = unsigned int;
using ll = long long;
using ull = unsigned long long;
using db = double;
using ld = long double;
using pii = pair <int,int>;
using pll = pair <ll,ll>;
using pdd = pair <double,double>;
using vint = vector <int>;
using vpii = vector <pii>;

#define fi first
#define se second
#define pb emplace_back
#define mpi make_pair
#define all(x) x.begin(),x.end()
#define sor(x) sort(all(x))
#define rev(x) reverse(all(x))
#define mem(x,v) memset(x,v,sizeof(x))
#define mcpy(x,y) memcpy(x,y,sizeof(y))
#define Time 1.0*clock()/CLOCKS_PER_SEC

pii operator + (pii a,pii b){return {a.fi+b.fi,a.se+b.se};}
pll operator + (pll a,pll b){return {a.fi+b.fi,a.se+b.se};}

const int N=2e5+5;
const int S=26;

// Suffix_Automaton
int las,tot;
int son[N][S],fa[N],len[N];
int ed[N],id[N],buc[N];
void insS(char s){
	int cur=++tot,p=las,it=s-'a';
	len[cur]=len[las]+1,las=cur,ed[cur]=1;
	while(p&&!son[p][it])son[p][it]=cur,p=fa[p];
	if(!p)return fa[cur]=1,void();
	int q=son[p][it];
	if(len[p]+1==len[q])return fa[cur]=q,void();
	int c=++tot;
	fa[c]=fa[q],fa[q]=c,fa[cur]=c,len[c]=len[p]+1;
	for(int i=0;i<26;i++)son[c][i]=son[q][i];
	while(p&&son[p][it]==q)son[p][it]=c,p=fa[p];
} void build(char *s){
	int n=strlen(s+1); las=tot=1;
	for(int i=1;i<=n;i++)insS(s[i]),ed[las]=i;
	for(int i=1;i<=tot;i++)buc[len[i]]++;
	for(int i=1;i<=tot;i++)buc[i]+=buc[i-1];
	for(int i=tot;i;i--)id[buc[len[i]]--]=i;
}

// Chairman_Tree
int node,rt[N],ls[N<<5],rs[N<<5];
void insC(int l,int r,int p,int ori,int &x){
	x=++node;
	if(l==r)return;
	int m=l+r>>1;
	if(p<=m)insC(l,m,p,ls[ori],ls[x]),rs[x]=rs[ori];
	else insC(m+1,r,p,rs[ori],rs[x]),ls[x]=ls[ori];
} int merge(int l,int r,int x,int y){
	if(!x||!y)return x|y;
	if(x==y)return x;
	int m=l+r>>1,z=++node;
	ls[z]=merge(l,m,ls[x],ls[y]),rs[z]=merge(m+1,r,rs[x],rs[y]);
	return z;
} bool query(int l,int r,int ql,int qr,int x){
	if(!x||ql>qr)return 0;
	if(ql<=l&&r<=qr)return 1;
	int m=l+r>>1; bool ans=0;
	if(ql<=m)ans|=query(l,m,ql,qr,ls[x]);
	if(m<qr)ans|=query(m+1,r,ql,qr,rs[x]);
	return ans;
}

char s[N],t[N],ans[N];
int q,n,l,r,tag;
bool dfs(int i,int p){
	if(i==n+2)return 0;
	int it=(i>n?0:t[i]-'a'),q=son[p][it];
	for(int j=it;j<26;j++){
		q=son[p][j];
		if(q&&query(1,tot,l+i-1,r,rt[q])){
			if(j==it&&i<=n&&!dfs(i+1,q))continue;
			ans[i]=j+'a';
			return 1;
		}
	} return 0;
}
int main(){
	scanf("%s",s+1),build(s);
	for(int i=1;i<=tot;i++)if(ed[i])insC(1,tot,ed[i],0,rt[i]);
	for(int i=tot;i;i--)rt[fa[id[i]]]=merge(1,tot,rt[fa[id[i]]],rt[id[i]]);
	cin>>q;
	while(q--){
		cin>>l>>r,tag=1;
		scanf("%s",t+1),n=strlen(t+1);
		if(dfs(1,1))cout<<(ans+tag)<<endl;
		else puts("-1");
		for(int i=1;ans[i];i++)ans[i]=0;
	}
	return 0;
}

*VI. P4770 [NOI2018] 你的名字

题意简述：给出 \(s,q\)，\(q\) 次询问 \(l,r,t\)，求 \(t\) 有多少个本质不同子串没有在 \(s[l:r]\) 中出现过。

~~一写写一天，最后还是看了题解。~~

记 \(pre_i\) 为与 \(s[l:r]\) 匹配的所有 \(t[1:i]\) 后缀的最长的长度，直接在 \(s\) 的 SAM 上面跳即可。设当前位置为 \(p\)，匹配长度为 \(L\)，区间为 \(l,r\)，那么直接查询是否存在一个位置 \(x\) 使得 \(x\in[l+L-1,r]\) 且 \(x\in\mathrm{endpos}(p)\) 即可（保证当前状态当前长度的字符串在 \(s[l:r]\) 中出现过），如果存在直接跳，不存在就将匹配长度减小 \(1\)（注意不是直接跳 \(\mathrm{link}\)！可能状态 \(p\) 时当前长度不满足，但是长度减小就满足了），如果长度减小到 \(\mathrm{len(link}(p))\) 再向上跳。根据上面一题的套路用线段树合并维护 \(\mathrm{endpos}\) 即可。

然后对 \(t\) 建 SAM，那么答案即为 \(\sum \max(0,\mathrm{len}(p)-\max(\mathrm{len(link}(p)),pre_{\mathrm{minr}(p)}))\)。其中 \(\mathrm{minr}(p)\) 表示 \(p\) 的 \(\mathrm{endpos}\) 集合中最小的位置。

稍微解释一下：该位置只能表示长度为 \((\mathrm{len(link}(p),\mathrm{len}(p)]\) 的子串，而如果长度不大于 \(pre_{\mathrm{minr}(p)}\) 就能被 \(s[l,r]\) 匹配，不符合题意。当然，如果不是 \(\mathrm{minr}\) 也可以，因为如果存在 \(pos,pos'\in \mathrm{endpos}(p)\) 使得 \(pre_{pos}\neq pre_{pos'}\)，那么 \(pre_{pos'}\) 显然不小于 \(\mathrm{len}(p)\)，因此可以推出 \(pre_{pos}\geq \mathrm{len}(p)\)，对答案没有贡献，只不过 \(\mathrm{minr}\) 好维护一点。

\(\mathrm{minr}\) 可以在建出 SAM 的时候一并维护。

Luogu P4770 代码

/*
	Powered by C++11.
	Author : Alex_Wei.
*/

#include <bits/stdc++.h>
using namespace std;

//#pragma GCC optimize(3)

//using int = long long
//using i128 = __int128;

using uint = unsigned int;
using ll = long long;
using ull = unsigned long long;
using db = double;
using ld = long double;
using pii = pair <int,int>;
using pll = pair <ll,ll>;
using pdd = pair <double,double>;
using vint = vector <int>;
using vpii = vector <pii>;

#define fi first
#define se second
#define pb emplace_back
#define mpi make_pair
#define all(x) x.begin(),x.end()
#define sor(x) sort(all(x))
#define rev(x) reverse(all(x))
#define mem(x,v) memset(x,v,sizeof(x))
#define mcpy(x,y) memcpy(x,y,sizeof(y))
#define Time 1.0*clock()/CLOCKS_PER_SEC

pii operator + (pii a,pii b){return {a.fi+b.fi,a.se+b.se};}
pll operator + (pll a,pll b){return {a.fi+b.fi,a.se+b.se};}

const int N=1e6+5;
const int S=26;
const int K=N*50;

struct SegTreeFusion{
	int node,rt[N],ls[K],rs[K];
	void ins(int l,int r,int p,int ori,int &x){
		x=++node;
		if(l==r)return void();
		int m=l+r>>1;
		if(p<=m)ins(l,m,p,ls[ori],ls[x]),rs[x]=rs[ori];
		else ins(m+1,r,p,rs[ori],rs[x]),ls[x]=ls[ori];
	} int merge(int l,int r,int x,int y){
		if(!x||!y)return x|y;
		if(l==r)return x;
		int m=l+r>>1,z=++node;
		ls[z]=merge(l,m,ls[x],ls[y]);
		rs[z]=merge(m+1,r,rs[x],rs[y]);
		return z;
	} bool query(int l,int r,int ql,int qr,int x){
		if(!x||ql>qr)return 0;
		if(ql<=l&&r<=qr)return 1;
		int m=l+r>>1,ans=0;
		if(ql<=m)ans|=query(l,m,ql,qr,ls[x]);
		if(m<qr)ans|=query(m+1,r,ql,qr,rs[x]);
		return ans;
	}
}st;

int n,q;
struct SAM{
	int cnt,las;
	int son[N][S],fa[N],len[N];
	int buc[N],id[N],minr[N];
	void clear(){
		mem(son[1],0),cnt=las=1;
	} void ins(char s,bool seg){
		int p=las,cur=++cnt,it=s-'a'; mem(son[las=cur],0);
		minr[cur]=len[cur]=len[p]+1;
		if(seg)st.ins(1,n,len[cur],0,st.rt[cur]);
		while(p&&!son[p][it])son[p][it]=cur,p=fa[p];
		if(!p)return fa[cur]=1,void();
		int q=son[p][it];
		if(len[p]+1==len[q])return fa[cur]=q,void();
		int c=++cnt;
		fa[c]=fa[q],fa[q]=fa[cur]=c,len[c]=len[p]+1,minr[c]=minr[q];
		for(int i=0;i<26;i++)son[c][i]=son[q][i];
		while(p&&son[p][it]==q)son[p][it]=c,p=fa[p];
	} void build(char *s,int ln,bool seg){
		clear();
		for(int i=1;i<=ln;i++)ins(s[i],seg);
		for(int i=0;i<=ln;i++)buc[i]=0;
		for(int i=1;i<=cnt;i++)buc[len[i]]++;
		for(int i=1;i<=ln;i++)buc[i]+=buc[i-1];
		for(int i=cnt;i;i--)id[buc[len[i]]--]=i;
		if(seg)for(int i=cnt;i>1;i--)
			st.rt[fa[id[i]]]=st.merge(1,n,st.rt[fa[id[i]]],st.rt[id[i]]);
	} void trans(int &p,int &ln,int l,int r,int c){
		while(1){
			if(son[p][c]&&st.query(1,n,l+ln,r,st.rt[son[p][c]]))
				return ln++,p=son[p][c],void();
			if(!ln)return;
			if(--ln==len[fa[p]])p=fa[p];
		}
	} ll cal(int p[]){
		ll ans=0;
		for(int i=2;i<=cnt;i++)ans+=max(0,len[i]-max(len[fa[i]],p[minr[i]]));
		return ans;
	}
}sams,samt;

int p[N];
char s[N],t[N];
int main(){
	scanf("%s",s+1),n=strlen(s+1);
	sams.build(s,n,1),cin>>q;
	for(int i=1,l,r;i<=q;i++){
		scanf("%s",t+1),cin>>l>>r;
		int len=strlen(t+1),pos=1;
		samt.build(t,len,0);
		for(int i=1;i<=len;i++)sams.trans(pos,p[i]=p[i-1],l,r,t[i]-'a');
		cout<<samt.cal(p)<<endl;
	}
	return 0;
}

*VII. CF666E Forensic Examination

题意简述：给出字符串 \(s\) 与 \(t_{1,2,\cdots,m}\)，\(q\) 次询问，求出 \(t_{[l,r]}\) 中出现 \(s[pl:pr]\) 次数最多的字符串编号最小值与次数。

~~码题十分钟，debug de 一年。~~

首先有这样一个技巧：

trick 4：找到 \(s[l:r]\) 在一个 SAM 中的状态，可以记录 \(s[1:r]\) 在 SAM 中匹配的的状态，然后在 \(link\) 树上倍增。需要特判 \(s[1:r]\) 在 SAM 中匹配长度小于 \(r-l+1\) 的情况，这时 \(s[l:r]\) 在 SAM 里面是没有的（如果 \(s\) 也在 SAM 中就不需要了，因为一定存在这个状态）。

将所有 \(t_i\) 建出一个广义 SAM，~~然而我不会广义 SAM~~，那么每次添加一个新字符串时，将 \(las\) 设为 \(1\) 即可。

多串 SAM 如果直接 \(las=1\) 不能判重！会挂掉！！

除此以外，假设跳到了表示 \(s[pl:pr]\) 的状态 \(p\)，那我们还需找到一个最小的 \(i\in[l,r]\) 使得 \(p\) 及 \(p\) 的子树中 \(t_i\) 的结束状态的个数最大，显然要线段树合并维护一个状态的 \(endpos\) 集合中出现在每个 \(t_i\) 中的位置个数，然后直接用线段树维护区间最大值和区间最大值的编号最小值即可。

注意点：如果多串 SAM 直接将 \(las\) 设为 \(1\) 并且不判重（即直接 \(cur=las+1\) 而不判断是否 \(las\) 已经有当前字符的转移）（只能不判重！！否则会破坏原有 SAM 的结构！），那么如果两个字符串的开头字符相同，可能会导致一个节点成了空节点（即没有入边，不包含任何字符串），从而使 \(len(link(i))=len(i)\)。这时就不能用桶排求拓扑序了，必须用 dfs。

~~这玩意调了 1.5h，刻骨铭心。~~

当然如果直接把 \(s\) 也塞进 SAM 也可以，不过会慢一些。

时间复杂度 \(\mathcal{O}((|s|+\sum|t_i|+q)\log \sum|t_i|)\)。

CF666E 代码

/*
	Powered by C++11.
	Author : Alex_Wei.
*/

#include <bits/stdc++.h>
using namespace std;

//#pragma GCC optimize(3)

//using int = long long
//using i128 = __int128;

using uint = unsigned int;
using ll = long long;
using ull = unsigned long long;
using db = double;
using ld = long double;
using pii = pair <int,int>;
using pll = pair <ll,ll>;
using pdd = pair <double,double>;
using vint = vector <int>;
using vpii = vector <pii>;

#define fi first
#define se second
#define pb emplace_back
#define mpi make_pair
#define all(x) x.begin(),x.end()
#define sor(x) sort(all(x))
#define rev(x) reverse(all(x))
#define mem(x,v) memset(x,v,sizeof(x))
#define mcpy(x,y) memcpy(x,y,sizeof(y))
#define Time 1.0*clock()/CLOCKS_PER_SEC

pii operator + (pii a,pii b){return {a.fi+b.fi,a.se+b.se};}
pll operator + (pll a,pll b){return {a.fi+b.fi,a.se+b.se};}

namespace IO{
	char buf[1<<23],*p1=buf,*p2=buf,obuf[1<<24],*O=obuf;
	#ifdef __WIN32
		#define gc getchar()
	#else
		#define gc (p1==p2&&(p2=(p1=buf)+fread(buf,1,1<<22,stdin),p1==p2)?EOF:*p1++)
	#endif
	#define pc(x) (*O++=x)
	#define flush() fwrite(obuf,O-obuf,1,stdout)
	inline ll read(){
		ll x=0; bool sign=0; char s=gc;
		while(!isdigit(s))sign|=s=='-',s=gc;
		while(isdigit(s))x=(x<<1)+(x<<3)+(s-'0'),s=gc;
		return sign?-x:x;
	}
	inline void print(ll x){
		if(x<0)pc('-'),print(-x);
		else{
			if(x>9)print(x/10);
			pc(x%10+'0');
		}
	}
} using namespace IO;

const int N=2e6+5;
const int M=5e4+5;
const int S=26;

int node,rt[N],ls[M<<6],rs[M<<6];
pii val[M<<6];
pii merge(pii x,pii y){
	int z=max(x.fi,y.fi);
	if(x.se>y.se)swap(x,y);
	return {z,x.fi==z?x.se:y.se};
} void ins(int l,int r,int p,int &x){
	if(!x)x=++node;
	if(l==r)return val[x].fi++,val[x].se=p,void();
	int m=l+r>>1;
	if(p<=m)ins(l,m,p,ls[x]);
	else ins(m+1,r,p,rs[x]);
	val[x]=merge(val[ls[x]],val[rs[x]]);
} int merge(int l,int r,int x,int y){
	if(!x||!y)return x|y;
	int z=++node,m=l+r>>1;
	if(l==r){
		val[z].fi=val[x].fi+val[y].fi;
		val[z].se=min(val[x].se,val[y].se);
		return z;
	} ls[z]=merge(l,m,ls[x],ls[y]),rs[z]=merge(m+1,r,rs[x],rs[y]);
	return val[z]=merge(val[ls[z]],val[rs[z]]),z;
} pii query(int l,int r,int ql,int qr,int x){
	if(!x)return {0,0};
	if(ql<=l&&r<=qr)return val[x];
	int m=l+r>>1; pii ans={0,0};
	if(ql<=m)ans=query(l,m,ql,qr,ls[x]);
	if(m<qr)ans=merge(ans,query(m+1,r,ql,qr,rs[x]));
	return ans;
}

int n,m,cnt,las;
int son[N][S],fa[N],len[N];
int buc[N],id[N],f[N][S],ed[N],mxl[N];
vector <int> e[N];
void ins(char s,int id){
	int p=las,it=s-'a',cur=++cnt;
	len[cur]=len[las]+1,las=cur,ins(1,m,id,rt[cur]);
	while(p&&!son[p][it])son[p][it]=cur,p=fa[p];
	if(!p)return fa[cur]=1,void();
	int q=son[p][it];
	if(len[p]+1==len[q])return fa[cur]=q,void();
	int c=++cnt;
	fa[c]=fa[q],fa[q]=fa[cur]=c,len[c]=len[p]+1;
	for(int i=0;i<26;i++)son[c][i]=son[q][i];
	while(p&&son[p][it]==q)son[p][it]=c,p=fa[p];
} void build(char *s,int id){
	int n=strlen(s+1); las=1;
	if(id==1)cnt=1;
	for(int i=1;i<=n;i++)ins(s[i],id);
} void dfs(int id){
	for(int it:e[id])dfs(it),rt[id]=merge(1,m,rt[id],rt[it]);
}

int p,q,pl,pr,l,r;
char s[N],t[N];
int main(){
	scanf("%s",s+1),cin>>m;
	n=strlen(s+1);
	for(int i=1;i<=m;i++)scanf("%s",t+1),build(t,i);
	for(int i=1,p=1,l=0;i<=n;i++){
		while(p&&!son[p][s[i]-'a'])p=fa[p],l=len[p];
		if(!p)p=1,l=0; else p=son[p][s[i]-'a'],l++;
		ed[i]=p,mxl[i]=l;
	}
	for(int j=0;1<<j<=cnt;j++)for(int i=1;i<=cnt;i++)f[i][j]=j?f[f[i][j-1]][j-1]:fa[i];
	for(int i=2;i<=cnt;i++)e[fa[i]].pb(i); dfs(1);
	cin>>q; while(q--){
		l=read(),r=read(),pl=read(),pr=read(),p=ed[pr];
		if(mxl[pr]<pr-pl+1){
			cout<<l<<" 0\n";
			continue;
		} for(int i=log2(cnt);~i;i--)if(pr-len[f[p][i]]+1<=pl)p=f[p][i];
		pii ans=query(1,m,l,r,rt[p]);
		cout<<max(l,ans.se)<<" "<<ans.fi<<"\n";
	}
	return 0;
}

VIII. P4022 [CTSC2012]熟悉的文章

题意简述：给出字典 \(T_{1,2,\cdots,m}\)，多次询问一个字符串 \(s\) 的 \(L_0\)，其中 \(L_0\) 表示：将 \(s\) 分为若干子串，使得所有长度不小于 \(l\) 且在字典 \(T\) 中出现过的子串长度之和不小于 \(0.9|s|\) 的 \(l\) 的最大值。

首先这个 \(L_0\) 显然具有可二分性，那我们将题目转化为给出 \(l\) 求满足条件的长度最大值。设 \(f_i\) 表示 \(s[1:i]\) 能匹配的最大值，那么显然有 \(f_i=\max(f_{i-1},\max_{j=i-pre_i}^{i-l} f_j+1)\)，其中 \(pre_i\) 是 \(s[1:i]\) 在字典 \(T\) 中的最大匹配长度。可以发现决策点单调不减（因为每向右移动一位，\(pre\) 最多增加一位，所以 \(i-pre_i\) 单调不减），那么单调队列就好了。

求 \(pre_i\) 直接广义 SAM 即可。注意如果在插入新字符串时直接 \(las=1\)，是不能判断当前状态是否已有转移并直接跳过去（而不是新建一个状态）的，因为这样会破坏原有的 SAM 的结构。

时间复杂度 \(\mathcal{O}(\sum |T_i|+\sum |s|\log \sum |s|)\)。

Luogu P4022 代码

/*
	Powered by C++11.
	Author : Alex_Wei.
*/

#include <bits/stdc++.h>
using namespace std;

#define mcpy(x,y) memcpy(x,y,sizeof(y))

const int N=2.2e6+5;

// Suffix_Automaton
int n,m;
int cnt,las;
int fa[N],len[N],son[N][2];
void ins(int it){
	int p=las,cur=++cnt;
	len[cur]=len[las]+1,las=cur;
	while(p&&!son[p][it])son[p][it]=cur,p=fa[p];
	if(!p)return fa[cur]=1,void();
	int q=son[p][it];
	if(len[p]+1==len[q])return fa[cur]=q,void();
	int cl=++cnt;
	fa[cl]=fa[q],fa[q]=fa[cur]=cl,len[cl]=len[p]+1;
	son[cl][0]=son[q][0],son[cl][1]=son[q][1];
	while(p&&son[p][it]==q)son[p][it]=cl,p=fa[p];
} void build(char *s){
	int n=strlen(s+1); las=1;
	for(int i=1;i<=n;i++)ins(s[i]-'0');
}

int f[N],d[N],hd,tl;
char s[N];
int check(int x){
	int n=strlen(s+1),p=1,l=0,ans=0; hd=1,tl=0;
	for(int i=1;i<=n;i++){
		int it=s[i]-'0';
		while(p&&!son[p][it])p=fa[p],l=len[p];
		if(!p)p=1,l=0;
		else p=son[p][it],l++;
		if(i>=x){
			while(hd<=tl&&f[d[tl]]+(i-x-d[tl])<=f[i-x])tl--;
			d[++tl]=i-x;
		} while(hd<=tl&&d[hd]+l<i)hd++;
		if(hd<=tl)f[i]=max(f[i-1],f[d[hd]]+(i-d[hd]));
		else f[i]=f[i-1];
		ans=max(ans,f[i]);
	} return ans;
}

int main(){
	cin>>n>>m,cnt=1;
	for(int i=1;i<=m;i++)scanf("%s",s+1),build(s);
	for(int i=1;i<=n;i++){
		scanf("%s",s+1);
		int n=strlen(s+1),l=0,r=n;
		while(l<r){
			int m=(l+r>>1)+1;
			if(check(m)>=n*0.9)l=m;
			else r=m-1;
		} cout<<l<<"\n";
	}
	return 0;
}

IX. CF616F Expensive Strings

题意简述：给出 \(t_{1,2,\cdots,n}\) 和 \(c_{1,2,\cdots,n}\)，求 \(\max f(s)=\sum_i^n c_i\times p_{s,i} \times |s|\) 的最大值，其中 \(s\) 为任意字符串，\(p_{s,i}\) 为 \(s\) 在 \(t_i\) 中的出现次数。

广义 SAM 板子题。

考虑 SAM 上每个状态所表示的意义：出现位置相同的字符串集合。也就是说，对于 SAM 上的一个状态 \(t\)，它所表示的所有字符串 \(s\) 的 \(\sum_{i=1}^n c_i\times p_{s,i}\) 是相同的，所以它对答案的可能贡献就是 \(\sum_{i=1}^n c_i\times p_{s,i}\times len(t)\)。\(\sum_{i=1}^n c_i\times p_{s,i}\) 可以直接在 \(link\) 树上树形 DP 求出。~~我一开始还以为要线段树合并，做题做傻了。~~

一些注意点：如果你写的是 \(las=1\) 版本的伪广义 SAM，如果不判重，可能会建空节点 \(p\)，此时 \(len(link(p))=len(p)\)。所以特判一下这种情况就行了，否则会 WA on 16，并且 “expected 0，found 500”。

同时，答案的初始值应赋为 \(0\) 而不是 \(-\infty\)，因为只要让 \(s\) 不在任何一个 \(t_i\) 中出现过就可以 \(f(s)=0\)。

~~一开始直接拿 P4022 熟悉的文章的广义 SAM 写的，那个题目是 01 串，所以复制儿子只复制了 0 和 1（这题就是 a 和 b），然后过了 43 个测试点。~~

CF616F 代码

/*
	Powered by C++11.
	Author : Alex_Wei.
*/

#include <bits/stdc++.h>
using namespace std;

//#pragma GCC optimize(3)

//using int = long long
//using i128 = __int128;

using uint = unsigned int;
using ll = long long;
using ull = unsigned long long;
using db = double;
using ld = long double;
using pii = pair <int,int>;
using pll = pair <ll,ll>;
using pdd = pair <double,double>;
using vint = vector <int>;
using vpii = vector <pii>;

#define fi first
#define se second
#define pb emplace_back
#define mpi make_pair
#define all(x) x.begin(),x.end()
#define sor(x) sort(all(x))
#define rev(x) reverse(all(x))
#define mem(x,v) memset(x,v,sizeof(x))
#define mcpy(x,y) memcpy(x,y,sizeof(y))
#define Time 1.0*clock()/CLOCKS_PER_SEC

const int N=1e6+5;

// Suffix_Automaton
int cnt,las;
int fa[N],len[N],son[N][26];
ll val[N];
vector <int> e[N];
void ins(int it,int v){
	int p=las,cur=++cnt;
	len[cur]=len[las]+1,las=cur,val[cur]=v;
	while(p&&!son[p][it])son[p][it]=cur,p=fa[p];
	if(!p)return fa[cur]=1,void();
	int q=son[p][it];
	if(len[p]+1==len[q])return fa[cur]=q,void();
	int cl=++cnt;
	fa[cl]=fa[q],fa[q]=fa[cur]=cl,len[cl]=len[p]+1;
	mcpy(son[cl],son[q]);
	while(p&&son[p][it]==q)son[p][it]=cl,p=fa[p];
} void build(string s,int v){
	las=1;
	for(int i=0;i<s.size();i++)ins(s[i]-'a',v);
} void dfs(int id){
	for(int it:e[id])dfs(it),val[id]+=val[it];
}

int n;
ll ans;
string s[N];
int main(){
	cin>>n,cnt=1;
	for(int i=1;i<=n;i++)cin>>s[i];
	for(int i=1,c;i<=n;i++)cin>>c,build(s[i],c);
	for(int i=1;i<=cnt;i++)e[fa[i]].pb(i);
	dfs(1); for(int i=1;i<=cnt;i++)if(len[fa[i]]!=len[i])ans=max(ans,len[i]*val[i]);
	cout<<ans<<endl;
	return 0;
}

X. P4094 [HEOI2016/TJOI2016]字符串

题意简述：给出字符串 \(s\)，多次询问 \(a,b,c,d\) 求 \(s[a:b]\) 的所有子串与 \(s[c:d]\) 的最长公共前缀的最大值。

这个 SAM 套路见多了的话还是挺简单的吧。

首先，SAM 不太方便处理前缀，所以将整个串翻转（询问不要忘记翻转），这样就转化为了最长公共后缀。接下来求 \(s[1:d]\) 所代表的状态，设为 \(p\)，直接在建 SAM 时预处理即可。

直接不管 \(c\) 的限制，问题转化为求出 \(s[a:b]\) 所有子串与 \(s[1:d]\) 的最长公共后缀长度，并与 \(d-c+1\) 取 \(\min\)。

根据 SAM 的性质，\(link\) 树上所有 \(p\) 的祖先都表示 \(s[1:d]\) 的一个或多个后缀。我们可以找到一个状态 \(q\) 满足 \(q\) 是 \(p\) 的祖先且 \(\left(\max_{x\in endpos(q),x\leq b}x\right)-a+1\leq len(q)\)（也就是该状态所表示的字符串在 \(b\) 或 \(b\) 之前出现的最靠右的结束位置，至于为什么要最靠右显而易见（右边的出现位置肯定优于左边的出现位置，因为有左端点 \(a\) 的限制），读者可自行理解），且 \(len(q)\) 的值最小，那么最长公共后缀肯定在 \(q\) 或 \(link(q)\) 所表示的子串中。

先说说为什么要 \(len(q)\) 最小：假设存在 \(q'\) 满足上述条件，但 \(len(q')>len(q)\)，即 \(q\) 是 \(q'\) 的祖先（同时 \(q'\) 是 \(p\) 的祖先）。记 \(\max_{x\in endpos(q),x\leq b}x\) 为 \(maxp(q,b)\)，那么根据 \(endpos\) 和 \(link\) 的性质，即 \(endpos(q')\subsetneq endpos(q)\)，因此，\(maxp(q',b)\leq maxp(q,b)\)，即 \(q'\) 点所表示字符串在 \(b\) 或 \(b\) 之前出现的最大结束位置，一定不大于 \(q\) 点所表示的字符串在 \(b\) 或 \(b\) 之前出现的最大结束位置。因此 \(maxp(q',b)-a+1\leq maxp(q,b)-a+1\)。又因为 \(len(q)\ (len(q'))\geq maxp(q,b)\ (maxp(q',b)) -a+1\)，即 \(q\) 和 \(q'\) 所表示的的最长字符串超出了 \(a\) 的限制，所以我们是用 \(maxp\) 值 \(-a+1\) 求出在 \(a\) 的限制下该状态对答案的贡献。故 \(q\) 一定比 \(q'\) 更优。
再说说为什么要算上 \(link(q)\)：

一目了然，不言而喻。
同时，因为 \(link(q)\) 的贡献已经是 \(len(q)\) 了，如果再往上跳 \(maxp\) 递增，贡献也一定是该点的 \(len\) 值，这是递减的，所以不需要再往上考虑。

说完了思路，接下来讲讲怎么实现：用线段树合并维护 \(endpos\) 集合可以轻松在 \(\log\) 时间内求出 \(maxp\)。同时，因为满足条件的 \(q\) 满足二分条件，所以求 \(q\) 直接用 \(p\) 在 \(link\) 树上倍增即可。那么最后答案即为 \(\min(\max(maxp(q,b)-a+1,len(link(q))),d-c+1)\)。（不需要特判答案为 \(0\) 的情况，因为此时 \(maxp(q,b)-a+1\) 不小于 \(0\)，而 \(len(link(q))\) 显然为 \(0\)）

时间复杂度 \(\mathcal{O}(q\log^2 n)\)。

Luogu P4094 代码

/*
	Powered by C++11.
	Author : Alex_Wei.
*/

#include <bits/stdc++.h>
using namespace std;

//#pragma GCC optimize(3)

//using int = long long
//using i128 = __int128;

using uint = unsigned int;
using ll = long long;
using ull = unsigned long long;
using db = double;
using ld = long double;
using pii = pair <int,int>;
using pll = pair <ll,ll>;
using pdd = pair <double,double>;
using vint = vector <int>;
using vpii = vector <pii>;

#define fi first
#define se second
#define pb emplace_back
#define mpi make_pair
#define all(x) x.begin(),x.end()
#define sor(x) sort(all(x))
#define rev(x) reverse(all(x))
#define mem(x,v) memset(x,v,sizeof(x))
#define mcpy(x,y) memcpy(x,y,sizeof(y))

const int N=2e5+5;
const int S=26;

int node,rt[N],ls[N<<5],rs[N<<5],val[N<<5];
void push(int x){
	val[x]=max(val[ls[x]],val[rs[x]]);
} void ins(int l,int r,int p,int &x){
	x=++node;
	if(l==r)return val[x]=p,void();
	int m=l+r>>1;
	if(p<=m)ins(l,m,p,ls[x]);
	else ins(m+1,r,p,rs[x]);
	push(x);
} int merge(int l,int r,int x,int y){
	if(!x||!y)return x|y;
	int z=++node,m=l+r>>1;
	if(l==r)return val[z]=max(val[x],val[y]),z;
	ls[z]=merge(l,m,ls[x],ls[y]),rs[z]=merge(m+1,r,rs[x],rs[y]);
	return push(z),z;
} int query(int l,int r,int ql,int qr,int x){
	if(!x)return 0;
	if(ql<=l&&r<=qr)return val[x];
	int m=l+r>>1,ans=0;
	if(ql<=m)ans=query(l,m,ql,qr,ls[x]);
	if(m<qr)ans=max(ans,query(m+1,r,ql,qr,rs[x]));
	return ans;
}

// Suffix_Automaton
int a,b,c,d;
int n,m,K,cnt,las;
int fa[N],len[N],son[N][S];
int buc[N],id[N],f[N][S],ed[N];
vector <int> e[N];
void ins(int it){
	int p=las,cur=++cnt;
	len[cur]=len[las]+1,las=cur;
	ins(1,n,len[cur],rt[cur]),ed[len[cur]]=cur;
	while(p&&!son[p][it])son[p][it]=cur,p=fa[p];
	if(!p)return fa[cur]=1,void();
	int q=son[p][it];
	if(len[p]+1==len[q])return fa[cur]=q,void();
	int cl=++cnt;
	fa[cl]=fa[q],fa[q]=fa[cur]=cl,len[cl]=len[p]+1;
	mcpy(son[cl],son[q]);
	while(p&&son[p][it]==q)son[p][it]=cl,p=fa[p];
} void build(char *s){
	las=cnt=1,K=log2(n);
	for(int i=1;i<=n;i++)ins(s[i]-'a');
	for(int i=1;i<=cnt;i++)buc[len[i]]++;
	for(int i=1;i<=n;i++)buc[i]+=buc[i-1];
	for(int i=cnt;i;i--)id[buc[len[i]]--]=i;
	for(int i=cnt;i>1;i--)rt[fa[id[i]]]=merge(1,n,rt[fa[id[i]]],rt[id[i]]);
	for(int j=0;j<=K;j++)for(int i=1;i<=cnt;i++)f[i][j]=j?f[f[i][j-1]][j-1]:fa[i];
} int qpos(int pos){
	return query(1,n,1,b,rt[pos]);
}

char s[N];
int main(){
	cin>>n>>m,scanf("%s",s+1);
	reverse(s+1,s+n+1),build(s);
	while(m--){
		cin>>a>>b>>c>>d;
		a=n-a+1,b=n-b+1,c=n-c+1,d=n-d+1,swap(a,b),swap(c,d);
		int p=ed[d];
		for(int i=K;~i;i--)if(f[p][i]){
			int pp=f[p][i],pos=qpos(pp);
			if(len[pp]>=pos-a+1)p=pp;
		} int pos=qpos(p);
		cout<<min(d-c+1,max(pos-a+1,len[f[p][0]]))<<endl;
	}
	return 0;
}

*XI. P5284 [十二省联考2019]字符串问题

题意自己看吧，懒得简述了。

~~这题目一看就很 SAM，而且 SAM 套路做多了就是一眼题。~~

首先看到 “\(B\) 类串为 \(t_{i+1}\) 的前缀” 直接建出反串的 SAM，因此以一个 \(B\) 类串 \(B_i\) 为后缀的所有 \(S\) 的子串为在 SAM 上 \(B_i\) 所表示状态 \(p\) 在 fail 树上的子树。因此一个 \(A\) 类串 \(A_i\) 可以和若干个 fail 树的子树接在一起。那么直接向能接在一起的所有相邻的子串连边，然后如果出现环则无解。可是这样连边是 \(\mathcal{O}(n^2)\) 的。

trick 5：使用 SAM 的 fail 树优化建图。

既然是一个点向所有子树连边，那么直接在原 fail 树的基础上将该点与子树的根节点连起来即可。这样就可做到 \(\mathcal{O}(n)\) 规模。

一个注意点：注意到一个状态可能对应多个子串，那么将该状态的所有 \(A,B\) 类串按长度从小到大为第一关键字，是否是 \(B\) 类串为第二关键字排序，然后按顺序拆点即可（所在状态相同的长度相同 \(A,B\) 类串相等，\(A\) 串可以作 \(B\) 串的子串，所以 \(B\) 串要是 \(A\) 串的祖先）

然而我没有想到在 fail 树上建图，是直接用线段树优化建图，线段树优化 DAG 上 DP，于是 2h 码了细节巨大多的 5k。看到题解后才学会这样的技巧。好题！

~~能看懂代码算我输。~~

Luogu P5284 代码

/*
	Powered by C++11.
	Author : Alex_Wei.
*/

#include <bits/stdc++.h>
using namespace std;

using ll = long long;
using vint = vector <int>;

#define pb emplace_back
#define all(x) x.begin(),x.end()
#define rev(x) reverse(all(x))
#define mem(x,v) memset(x,v,sizeof(x))
#define mcpy(x,y) memcpy(x,y,sizeof(y))

const int N=4e5+5;
const int S=26;
const int inf=1e9+7;

// Segtree_Min
int deg[N],val[N<<2],laz[N<<2];
void up(int x){
	val[x]=min(val[x<<1],val[x<<1|1]);
} void down(int x){
	if(laz[x]){
		val[x<<1]-=laz[x],val[x<<1|1]-=laz[x];
		laz[x<<1]+=laz[x],laz[x<<1|1]+=laz[x];
	} laz[x]=0;
} void build(int l,int r,int x){
	laz[x]=val[x]=0;
	if(l==r)return val[x]=deg[l],void();
	int m=l+r>>1;
	build(l,m,x<<1),build(m+1,r,x<<1|1),up(x);
} void modify(int l,int r,int ql,int qr,int x){
	if(ql<=l&&r<=qr)return val[x]--,laz[x]++,void();
	int m=l+r>>1; down(x);
	if(ql<=m)modify(l,m,ql,qr,x<<1);
	if(m<qr)modify(m+1,r,ql,qr,x<<1|1); up(x);
} int query(int l,int r,int x){
	if(l==r)return val[x]=inf,l;
	int m=l+r>>1,ans; down(x);
	if(!val[x<<1])ans=query(l,m,x<<1);
	else ans=query(m+1,r,x<<1|1);
	return up(x),ans;
}

// SegTree_Max
ll ini[N<<2],val2[N<<2],laz2[N<<2];
void cmax(ll &x,ll y){
	x=max(x,y);
} void up2(int x){
	val2[x]=max(val2[x<<1],val2[x<<1|1]);
} void down2(int x){
	if(laz[x]!=-1){
		cmax(laz2[x<<1],laz2[x]),cmax(laz2[x<<1|1],laz2[x]);
		cmax(val2[x<<1],laz2[x]),cmax(val2[x<<1|1],laz2[x]);
	} laz2[x]=-1;
} void build2(int l,int r,int x){
	val2[x]=laz2[x]=-1;
	if(l==r)return val2[x]=ini[l],void();
	int m=l+r>>1;
	build2(l,m,x<<1),build2(m+1,r,x<<1|1),up2(x);
} void modify2(int l,int r,int ql,int qr,int x,ll v){
	if(ql<=l&&r<=qr)return cmax(val2[x],v),cmax(laz2[x],v),void();
	int m=l+r>>1; down2(x);
	if(ql<=m)modify2(l,m,ql,qr,x<<1,v);
	if(m<qr)modify2(m+1,r,ql,qr,x<<1|1,v); up2(x);
} ll query2(int l,int r,int p,int x){
	if(l==r)return val2[x];
	int m=l+r>>1; down2(x);
	if(p<=m)return query2(l,m,p,x<<1);
	return query2(m+1,r,p,x<<1|1);
}

// Suffix_Automaton
int n,K,cnt,las;
int fa[N],len[N],ed[N],son[N][S],ff[N][S];
vint FAIL[N];
void ins(char s){
	int p=las,cur=++cnt,it=s-'a';
	len[cur]=len[las]+1,ed[len[cur]]=cur,las=cur;
	while(p&&!son[p][it])son[p][it]=cur,p=fa[p];
	if(!p)return fa[cur]=1,void();
	int q=son[p][it];
	if(len[p]+1==len[q])return fa[cur]=q,void();
	int cl=++cnt;
	fa[cl]=fa[q],fa[q]=fa[cur]=cl,len[cl]=len[p]+1;
	mcpy(son[cl],son[q]);
	while(son[p][it]==q)son[p][it]=cl,p=fa[p];
} void build(char *s){
	for(int i=1;i<=n;i++)ins(s[i]);
	for(int i=2;i<=cnt;i++)FAIL[fa[i]].pb(i),ff[i][0]=fa[i];
	K=log2(cnt);
	for(int i=1;i<=K;i++)for(int j=1;j<=cnt;j++)ff[j][i]=ff[ff[j][i-1]][i-1];
} int getpos(int l,int r){
	int p=ed[r];
	for(int i=K;~i;i--)if(r-len[ff[p][i]]+1<=l)p=ff[p][i];
	return p;
}


char s[N];
int na,nb,tot,m;
int dnum,lens[N],tmp[N],rev[N],id[N],sz[N];
vint DAG[N],tag[N];

bool cmp(int a,int b){
	return lens[a]!=lens[b]?lens[a]<lens[b]:a>b;
} int dfs(int d){
	int z=tag[d].size(),l=dnum+1,r=dnum+z;
	sort(all(tag[d]),cmp);
	for(int it:tag[d])id[it]=++dnum;
	for(int it:FAIL[d])z+=dfs(it);
	for(int i=l;i<=r;i++)sz[i]=z-(i-l);
	return z;
}

void clear(){
	for(int i=1;i<=cnt;i++)mem(son[i],0),mem(ff[i],0),ed[i]=len[i]=fa[i]=0;
	for(int i=1;i<=cnt;i++)FAIL[i].clear(),tag[i].clear();
	for(int i=1;i<=tot+1;i++)lens[i]=id[i]=sz[i]=deg[i]=0;
	for(int i=1;i<=na;i++)DAG[i].clear();
	las=cnt=1,dnum=na=nb=tot=0;
} void init(){
	scanf("%s%d",s+1,&na),n=strlen(s+1);
	reverse(s+1,s+n+1),build(s);
	for(int i=1;i<=na;i++){
		int l,r; scanf("%d%d",&l,&r);
		l=n-l+1,r=n-r+1,swap(l,r),lens[i]=r-l+1;
		tag[getpos(l,r)].pb(i);
	} scanf("%d",&nb),tot=na+nb;
	for(int i=1;i<=nb;i++){
		int l,r; scanf("%d%d",&l,&r);
		l=n-l+1,r=n-r+1,swap(l,r),lens[i+na]=r-l+1;
		tag[getpos(l,r)].pb(i+na);
	} scanf("%d",&m);
	for(int i=1;i<=m;i++){
		int x,y; scanf("%d%d",&x,&y);
		DAG[x].pb(y+na);
	} dfs(1);
	for(int i=1;i<=tot;i++)tmp[id[i]]=lens[i];
	for(int i=1;i<=tot;i++)lens[i]=tmp[i],rev[id[i]]=i;
}

queue <int> q;
bool update(){
	if(val[1])return 0;
	int p=query(1,tot,1);
	return ini[p]=0,q.push(p),1;
} bool calc_deg(){
	for(int i=1;i<=na;i++)
		for(int it:DAG[i]){
			int l=id[it],r=l+sz[l]-1;
			if(l<=id[i]&&id[i]<=r)return 1;
			deg[l]++,deg[r+1]--;
		}
	for(int i=1;i<=tot;i++)deg[i]+=deg[i-1];
	for(int i=na+1;i<=tot;i++)deg[id[i]]=inf;
	return build(1,tot,1),0;
} ll topo(){
	for(int i=1;i<=tot;i++)ini[i]=-1;
	while(update()); build2(1,tot,1);
	ll ans=0;
	while(!q.empty()){
		ll t=q.front(),v=query2(1,tot,t,1)+lens[t]; q.pop();
		cmax(ans,v);
		for(int it:DAG[rev[t]]){
			int l=id[it],r=l+sz[l]-1;
			modify(1,tot,l,r,1),modify2(1,tot,l,r,1,v);
			while(update());
		}
	} return val[1]<1e6?-1:ans;
}

void solve(){
	clear(),init();
	if(calc_deg())return puts("-1"),void();
	cout<<topo()<<endl;
} int main(){
	int t; cin>>t;
	while(t--)solve();
	return 0;
}

XII. CF235C Cyclical Quest

题意简述：给出 \(s\)，多次询问给出字符串 \(t\) 所有循环同构串去重后在 \(s\) 中出现次数之和。

如果没有循环同构那么就是 ACAM/SA/SAM 板子题。关于循环同构的一个常见套路就是将 \(t\) 复制一份在后面。那么我们如法炮制，用 \(2t\) 在 SAM 上跑匹配。如果当前长度大于 \(|t|\)，那么就不断将匹配长度 \(d\) 减一，同时判断当前状态是否能表示长度为 \(d\) 的字符串（即是否有 \(len(link(p))<d\leq len(p)\)），如果没有就要向上跳。

注意到题目需要去重，同时两个长度为 \(|t|\) 的 \(s\) 的不同子串一定被不同的状态表示，所以计算一个位置贡献后打上标记，后面再遇到这个位置就不算贡献了，每次查询后撤销标记即可（可以用 vector 记录打上标记的位置）。

时间复杂度为 \(\mathcal{O}(|s||\Sigma|+\sum|t|)\)，其中 \(\Sigma\) 为字符集。

CF235C 代码

/*
	Powered by C++11.
	Author : Alex_Wei.
*/

#include <bits/stdc++.h>
using namespace std;

#define ll long long
#define pb emplace_back

const int N=2e6+5;
const int S=26;

int las,cnt;
int son[N][S],len[N],fa[N],ed[N];
int buc[N],id[N],vis[N];
void ins(char s){
	int p=las,cur=++cnt,it=s-'a';
	len[cur]=len[p]+1,ed[cur]++,las=cur;
	while(p&&!son[p][it])son[p][it]=cur,p=fa[p];
	if(!p)return fa[cur]=1,void();
	int q=son[p][it];
	if(len[p]+1==len[q])return fa[cur]=q,void();
	int cl=++cnt;
	fa[cl]=fa[q],fa[q]=fa[cur]=cl,len[cl]=len[p]+1;
	memcpy(son[cl],son[q],sizeof(son[q]));
	while(son[p][it]==q)son[p][it]=cl,p=fa[p];
} void build(char *s){
	int n=strlen(s+1); las=cnt=1;
	for(int i=1;i<=n;i++)ins(s[i]);
	for(int i=1;i<=cnt;i++)buc[len[i]]++;
	for(int i=1;i<=cnt;i++)buc[i]+=buc[i-1];
	for(int i=cnt;i;i--)id[buc[len[i]]--]=i;
	for(int i=cnt;i;i--)ed[fa[id[i]]]+=ed[id[i]];
}

int n;
char s[N];
int main(){
	scanf("%s%d",s+1,&n),build(s);
	for(int i=1;i<=n;i++){
		scanf("%s",s+1);
		ll p=1,l=strlen(s+1),d=0,ans=0;
		vector <int> del; 
		for(int i=1;i<l*2;i++){
			int it=s[i>l?i-l:i]-'a';
			while(p&&!son[p][it])p=fa[p],d=len[p];
			if(p){
				p=son[p][it],d++;
				while(d>l)if((--d)<=len[fa[p]])p=fa[p];
				if(d>=l&&!vis[p])ans+=ed[p],vis[p]=1,del.pb(p);
			} else p=1;
		} cout<<ans<<endl;
		for(int it:del)vis[it]=0;
	}
	return 0;
}

XIII. CF1073G Yet Another LCP Problem

见 CF1073G 题解。

~~怎么混进来一道 SA。~~

XIV. CF802I Fake News (hard)

题意简述：给出 \(s\)，求所有 \(s\) 的子串 \(p\) 在 \(s\) 中的出现次数平方和，重复的子串只算一次。

这是什么板子题？

对 \(s\) 建出 SAM 可以自动去重，考虑每个状态 \(p\)，它所表示的字串个数为 \(len(p)-len(link(p))\)，出现次数为 \(p\) 在 \(link\) 树上的子树所包含的终止节点个数（终止节点是 \(s\) 所有前缀在 SAM 上表示的状态），记为 \(ed_p\)。那么答案为 \(\sum_{i=1}^{cnt} ed^2_p\times (len(p)-len(link(p)))\)。

时间复杂度线性。

CF802I 代码

/*
	Powered by C++11.
	Author : Alex_Wei.
*/

#include <bits/stdc++.h>
using namespace std;

#define ll long long
#define mem(x,v) memset(x,v,sizeof(x))

const int N=2e5+5;
const int S=26;

int cnt,las,son[N][S],ed[N],fa[N],len[N],buc[N],id[N];
void clear(){
	mem(son,0),mem(ed,0),mem(fa,0),mem(len,0),mem(buc,0);
	cnt=las=1;
} void ins(char s){
	int p=las,cur=++cnt,it=s-'a';
	len[cur]=len[p]+1,las=cur,ed[cur]=1;
	while(!son[p][it])son[p][it]=cur,p=fa[p];
	if(!p)return fa[cur]=1,void();
	int q=son[p][it];
	if(len[p]+1==len[q])return fa[cur]=q,void();
	int cl=++cnt;
	fa[cl]=fa[q],fa[q]=fa[cur]=cl,len[cl]=len[p]+1;
	memcpy(son[cl],son[q],sizeof(son[q]));
	while(son[p][it]==q)son[p][it]=cl,p=fa[p];
} ll build(char *s){
	int n=strlen(s+1); clear();
	for(int i=1;i<=n;i++)ins(s[i]);
	for(int i=1;i<=cnt;i++)buc[len[i]]++;
	for(int i=1;i<=n;i++)buc[i]+=buc[i-1];
	for(int i=cnt;i;i--)id[buc[len[i]]--]=i;
	for(int i=cnt;i;i--)ed[fa[id[i]]]+=ed[id[i]];
	ll ans=0;
	for(int i=1;i<=cnt;i++)ans+=1ll*ed[i]*ed[i]*(len[i]-len[fa[i]]);
	return ans;
}

int n;
char s[N];
int main(){
	cin>>n;
	for(int i=1;i<=n;i++)scanf("%s",s+1),cout<<build(s)<<endl; 
	return 0;
}

XV. CF123D String

题意简述：给出 \(s\)，求所有 \(s\) 的子串 \(p\) 在 \(s\) 中的出现位置的所有子串个数，字符串的重复子串只算一次。

这是什么板子题？

时间复杂度线性。

CF123D 代码

/*
	Powered by C++11.
	Author : Alex_Wei.
*/

#include <bits/stdc++.h>
using namespace std;

#define ll long long
#define mem(x,v) memset(x,v,sizeof(x))

const int N=2e5+5;
const int S=26;

int cnt,las,son[N][S],ed[N],fa[N],len[N],buc[N],id[N];
void clear(){
	mem(son,0),mem(ed,0),mem(fa,0),mem(len,0),mem(buc,0);
	cnt=las=1;
} void ins(char s){
	int p=las,cur=++cnt,it=s-'a';
	len[cur]=len[p]+1,las=cur,ed[cur]=1;
	while(!son[p][it])son[p][it]=cur,p=fa[p];
	if(!p)return fa[cur]=1,void();
	int q=son[p][it];
	if(len[p]+1==len[q])return fa[cur]=q,void();
	int cl=++cnt;
	fa[cl]=fa[q],fa[q]=fa[cur]=cl,len[cl]=len[p]+1;
	memcpy(son[cl],son[q],sizeof(son[q]));
	while(son[p][it]==q)son[p][it]=cl,p=fa[p];
} ll build(char *s){
	int n=strlen(s+1); clear();
	for(int i=1;i<=n;i++)ins(s[i]);
	for(int i=1;i<=cnt;i++)buc[len[i]]++;
	for(int i=1;i<=n;i++)buc[i]+=buc[i-1];
	for(int i=cnt;i;i--)id[buc[len[i]]--]=i;
	for(int i=cnt;i;i--)ed[fa[id[i]]]+=ed[id[i]];
	ll ans=0;
	for(int i=1;i<=cnt;i++)ans+=1ll*ed[i]*(ed[i]+1)/2*(len[i]-len[fa[i]]);
	return ans;
}

int n;
char s[N];
int main(){
	scanf("%s",s+1),cout<<build(s)<<endl; 
	return 0;
}

*XVI. P4384 [八省联考2018]制胡窜

题意简述：给出字符串 \(s\)，多次询问给出 \(l,r\)，求有多少对 \((i,j)\ (1\leq i<j\leq n,i+1<j)\) 使得 \(s_{1,i},s_{i+1,j-1},s_{j,n}\) 中至少出现一次 \(s_{l,r}\)。

套路题大赏 & 阿巴细节题（五一劳动节当然要写码农题）。

约定：记 \(len=r-l+1\)，\(t=s_{l,r}\)，\(l_{1,2,\cdots,c},r_{1,2,\cdots,c}\) 为 \(t\) 在 \(s\) 中所有出现位置（\(l\) 开头，\(r\) 结尾，有 \(l_i+len-1=r_i\)）。

转化题目所求数对 \((i,j)\)：不难看出其等价于在 \(i,j-1\) 处切两刀所得到的三个字符串中至少出现一次 \(t\)。正难则反，将答案写成 \(\binom{n-1}{2}-ans\)，其中 \(ans\) 表示切两刀切不出 \(t\) 的方案数。

当有三个及三个以上互不相交的 \(t\) 时：显然 \(ans=0\)。
当最左边的 \(t\) 与最右边的 \(t\) 相交（\(r_1+len>r_c\)）时：
- 若第一刀切在 \(l_1\) 左边，那么第二刀必须切在相交部分（\([l_c,r_1]\)）中间，方案数为 \((l_1-1)(r_1-p_c)\)。
- 若第一刀切在 \(l_i\) 与 \(l_{i+1}\ (i<c)\) 间，那么第二刀必须切在 \(l_c\) 与 \(r_{i+1}\) 间，方案数为 \((l_{i+1}-l_i)(r_{i+1}-l_c)\)。
- 若第一刀切在相交部分中间，第二刀可以切在其右边的任意一个位置，方案数为 \((n-r_1)+(n-r_1+1)+\cdots+(n-l_c-1)=\frac{(2n-r_1-l_c-1)(r_1-l_c)}{2}\)。
- 若第一刀切在相交部分右边，则 \(s_{1,i}\) 必然包含 \(t\)，舍去。
比较麻烦的是 part 2，因为枚举每一个位置时间复杂度必然会爆炸。根据两个字符串出现的开头结尾的相对位置不变进行变形：

\[\begin{aligned}&\sum_{1\leq i<c}(l_{i+1}-l_i)(r_{i+1}-l_c)\\=&\sum_{1\leq i<c}(r_{i+1}-r_i)(r_{i+1}-l_c)\\=&\sum_{1\leq i<c}r^2_{i+1}-r_ir_{i+1}-(r_{i+1}-r_i)l_c\\=&-(r_c-r_1)l_c+\sum_{1\leq i<c}r^2_{i+1}-r_ir_{i+1}\end{aligned} \]
因此我们只需在线段树上维护 \(\sum r^2_i\) 和 \(\sum r_ir_{i+1}\) 即可。
当左边的 \(t\) 与最右边的 \(t\) 不相交时：设 \(m\) 为使 \(r_i+len\leq r_c\) 的最大的 \(i\)。
- 若第一刀切在 \(l_m\) 左边，那么其右边有两个不相交的 \(t\)，但只能切割其中一个，舍去。
- 若第一刀切在 \(l_m\) 与 \(r_1\) 间，发现不方便统计，继续分类：设 \(lim\) 为使 \(l_i\leq r_1\) 的最大的 \(i\)。
  - 若第一刀切在 \(l_i\) 与 \(l_{i+1}\ (m\leq i<lim)\) 间：类似上文推一推即可，方案数为 \(-(r_{lim}-r_m)l_c+\sum_{m\leq i<lim}r^2_{i+1}-r_ir_{i+1}\)。
  - 若第一刀切在 \(l_{lim}\) 与 \(r_1\) 间，第二刀必须切在 \(l_c\) 与 \(r_{lim+1}\) 间（因为必须切掉第 \(lim+1\) 个 \(t\)），方案数为 \((r_1-l_{lim})(r_{lim+1}-l_2)\)。
- 若第一刀切在 \(r_1\) 右边，不符合题意，舍去。

理论分析完毕，接下来是实现：首先对 \(s\) 建出 SAM；根据 trick 4 用线段树合并维护 endpos 集合，以及区间 \(\min,\max,r^2_i,r_ir_{i+1}\)；同时根据 trick 3 可以倍增跳到 \(t\) 所表示的区间。总时间复杂度 \(\mathcal{O}((n+q)\log n)\)。

码完一遍过，可喜可贺。

P4384 代码

/*
	Author : Alex_Wei
	Problem : P4384 [八省联考2018]制胡窜
	Powered by C++11
	2021.4.26 20:22
*/

#include <bits/stdc++.h>
using namespace std;

using ll = long long;

const int N=2e5+5;
const int inf=1e9+7;
const int K=17;
const int S=10;

ll n,node;
char s[N];
int rt[N],ls[N<<6],rs[N<<6];
ll mi[N<<6],mx[N<<6],val[N<<6],sq[N<<6];
void push(int x){
	mi[x]=min(mi[ls[x]],mi[rs[x]]);
	mx[x]=max(mx[ls[x]],mx[rs[x]]);
	val[x]=val[ls[x]]+val[rs[x]]+mx[ls[x]]*(mi[rs[x]]<inf?mi[rs[x]]:0);
	sq[x]=sq[ls[x]]+sq[rs[x]];
} void modify(int l,int r,int p,int &x){
	x=++node;
	if(l==r)return mi[x]=mx[x]=l,sq[x]=1ll*l*l,void();
	int m=l+r>>1;
	if(p<=m)modify(l,m,p,ls[x]);
	else modify(m+1,r,p,rs[x]);
	push(x);
} int merge(int l,int r,int x,int y){
	if(!x||!y)return x|y;
	int z=++node,m=l+r>>1;
	if(l==r)return mi[z]=mx[z]=l,sq[x]=1ll*l*l,z;
	ls[z]=merge(l,m,ls[x],ls[y]),rs[z]=merge(m+1,r,rs[x],rs[y]);
	return push(z),z;
}

struct data{
	ll mi,mx,val,sq;
	data operator + (data x){
		return {min(mi,x.mi),max(mx,x.mx),val+x.val+mx*(x.mi<inf?x.mi:0),sq+x.sq};
	}
};

data query(int l,int r,int ql,int qr,int x){
	if(ql<=l&&r<=qr)return {mi[x],mx[x],val[x],sq[x]};
	int m=l+r>>1;
	if(ql<=m&&m<qr)return query(l,m,ql,qr,ls[x])+query(m+1,r,ql,qr,rs[x]);
	if(ql<=m)return query(l,m,ql,qr,ls[x]);
	return query(m+1,r,ql,qr,rs[x]);
}

int cnt,las;
int son[N][S],fa[N],len[N],ed[N];
int id[N],buc[N],anc[N][K];
void ins(char s){
	int it=s-'0',cur=++cnt,p=las;
	len[las=cur]=len[p]+1,ed[len[cur]]=cur;
	modify(1,n,len[cur],rt[cur]);
	while(!son[p][it])son[p][it]=cur,p=fa[p];
	if(!p)return fa[cur]=1,void();
	int q=son[p][it];
	if(len[p]+1==len[q])return fa[cur]=q,void();
	int cl=++cnt;
	fa[cl]=fa[q],fa[q]=fa[cur]=cl,len[cl]=len[p]+1;
	memcpy(son[cl],son[q],sizeof(son[q]));
	while(p&&son[p][it]==q)son[p][it]=cl,p=fa[p];
} void build(char *s){
	las=cnt=1;
	for(int i=0;i<n;i++)ins(s[i]);
	for(int i=0;i<K;i++)
		for(int j=1;j<=cnt;j++)
			if(i)anc[j][i]=anc[anc[j][i-1]][i-1];
			else anc[j][i]=fa[j];
	for(int i=1;i<=cnt;i++)buc[len[i]]++;
	for(int i=1;i<=n;i++)buc[i]+=buc[i-1];
	for(int i=cnt;i;i--)id[buc[len[i]]--]=i;
	for(int i=cnt;i;i--)rt[fa[id[i]]]=merge(1,n,rt[fa[id[i]]],rt[id[i]]);
}

ll sum(ll a,ll b){return (a+b)*(b-a+1)/2;}

int q,l,r;
int main(){
	memset(mi,0x3f,sizeof(mi));
	scanf("%d%d%s",&n,&q,s),build(s);
	while(q--){
		scanf("%d%d",&l,&r);
		int p=ed[r],ln=r-l+1;
		for(int i=K-1;~i;i--)if(len[anc[p][i]]>=ln)p=anc[p][i];
		data dt=query(1,n,1,n,rt[p]);
		ll lp=dt.mi,l1=lp-ln+1,rp=dt.mx,l2=rp-ln+1;
		ll ans=1ll*(n-1)*(n-2)/2;
		if(lp>=l2){
			ll cover=lp-l2+1;
			ans-=(l1-1)*(cover-1);
			ans-=(dt.sq-lp*lp)-dt.val-(rp-lp)*l2;
			ans-=sum(n-lp,n-l2-1);
			printf("%lld\n",ans);
			continue;
		}
		data dm=query(1,n,1,rp-ln,rt[p]);
		ll mp=dm.mx,lm=mp-ln+1;
		if(lp+ln<=mp){
			printf("%lld\n",ans);
			continue;
		}
		data dr=query(1,n,mp,lp+ln-1,rt[p]);
		ans-=(dr.sq-mp*mp)-dr.val-(dr.mx-mp)*l2;
		ans-=(lp-(dr.mx-ln+1))*(query(1,n,dr.mx+1,n,rt[p]).mi-l2);
		printf("%lld\n",ans);
	}
	return 0;
}

*XVII. （SA）P6095 [JSOI2015]串分割

显然的贪心是让最大位数最小，即 \(len=\lceil\frac{n}{k}\rceil\)。

同时答案满足可二分性，那么我们破环成链，枚举 \(len\) 个断点并判断是否可行。具体来说，假设当前匹配到 \(i\)，若 \(s_{i,i+len-1}\) 不大于二分的答案，那么就匹配 \(len\) 位，否则匹配 \(len-1\) 位。若总匹配位数不小于 \(n\) 则可行。

正确性证明：若可匹配 \(len\) 位时匹配 \(len-1\) 位，则下一次最多匹配 \(len\) 位，这与首先匹配 \(len\) 位的下一次匹配的最坏情况（即匹配 \(len-1\) 为）相同（\((len-1)+len=len+(len-1)\)）。得证。

P6095

#include <bits/stdc++.h>
using namespace std;

const int N=4e5+5;

char s[N];
int n,k,len;

int sa[N],rk[N<<1],ork[N<<1];
int buc[N],id[N],px[N];
bool cmp(int a,int b,int w){
	return ork[a]==ork[b]&&ork[a+w]==ork[b+w];
}
void build(int n){
	int m=128;
	for(int i=1;i<=n;i++)buc[rk[i]=s[i]]++;
	for(int i=1;i<=m;i++)buc[i]+=buc[i-1];
	for(int i=n;i;i--)sa[buc[rk[i]]--]=i;
	for(int w=1,p=0;w<=n;w<<=1,m=p,p=0){
		for(int i=n;i>n-w;i--)id[++p]=i;
		for(int i=1;i<=n;i++)if(sa[i]>w)id[++p]=sa[i]-w;
		for(int i=0;i<=m;i++)buc[i]=0;
		for(int i=1;i<=n;i++)buc[px[i]=rk[id[i]]]++;
		for(int i=1;i<=m;i++)buc[i]+=buc[i-1];
		for(int i=n;i;i--)sa[buc[px[i]]--]=id[i];
		for(int i=1;i<=n;i++)ork[i]=rk[i]; p=0;
		for(int i=1;i<=n;i++)rk[sa[i]]=cmp(sa[i],sa[i-1],w)?p:++p;
		if(p==n)break;
	}
}

bool check(int d){
	for(int i=1;i<=len;i++){
		int pos=i;
		for(int j=1;j<=k;j++){
			pos+=len-(rk[pos]>d);
			if(pos>=i+n)return 1;
		}
	} return 0;
}

int main(){
	scanf("%d%d%s",&n,&k,s+1);
	for(int i=1;i<=n;i++)s[i+n]=s[i];
	len=(n-1)/k+1,build(n<<1);
	int l=1,r=n*2;
	while(l<r){
		int m=l+r>>1;
		if(check(m))r=m;
		else l=m+1;
	} for(int i=sa[l];i<sa[l]+len;i++)cout<<s[i];
	return 0;
}

免责声明！

本站转载的文章为个人学习借鉴使用，本站对版权不负任何法律责任。如果侵犯了您的隐私权益，请联系本站邮箱yoyou2525@163.com删除。

猜您在找 C++ 编程技巧笔记记录（持续更新） chrome调试技巧--持续更新 python3.4学习笔记(六) 常用快捷键使用技巧，持续更新 markdown常用语法使用笔记+使用技巧(持续更新......) Flink异常笔记（持续更新） DID学习笔记（持续更新） PLSQL Developer 11 使用技巧(持续更新) ( 译、持续更新 ) JavaScript 上分小技巧(四) sourceInsight使用技巧，持续更新中~~~ ( 译、持续更新 ) JavaScript 上分小技巧(一)