Talk about 莫隊
莫隊算法,是莫濤dalao發明的一個神奇的優化暴力算法,它使用看似很simple的指針移動操作以及分塊的思想來將復雜度優化至\(O(n\sqrt n)\)
莫隊的基本思想也很簡單:
- 離線操作,在后面會提到我們通過排序來降低復雜度
- 設之前我們以及求出了區間\([l,r]\)的答案,那么我們考慮如何快速轉移到\([l+1,r],[l-1,r],[l,r-1],[l,r+1]\)
- 每一次利用之前的信息跳動指針即可得出答案
不過如果是這樣的話,只要出題人把數據造坑一點,讓你\(l,r\)指針一直左右移動,就可以卡到\(O(n^2)\)我還不如寫暴力
所以莫隊的精髓來了,既然都是詢問,那我們是否可以通過適當地改變詢問的順序來讓\(l,r\)跳轉的幅度更小一點。
所有我們可以利用分塊的思想來優化:對於兩個詢問,若在其\(l\)在同塊,那么將其\(r\)作為排序關鍵字,若\(l\)不在同塊,就將\(l\)作為關鍵字排序(這就是雙關鍵字)
這樣就可以優化時間復雜度么,我們看一下嚴格的證明(摘自大米餅的博客):
首先,枚舉\(m\)個答案,就一個\(m\)了。設分塊大小為\(unit\),元素\(i\)所屬的快為\(blk_i\)
分類討論:
①\(l\)的移動:若下一個詢問與當前詢問的\(l\)所在的塊不同,那么只需要經過最多\(2\cdot unit\)步可以使得\(l\)成功到達目標.復雜度為:\(O(m\cdot unit)\)
②\(r\)的移動:\(r\)只有在\(blk_l\)相同時才會有序(其余時候還是瘋狂地亂跳,你知道,一提到亂跳,那么每一次最壞就要跳\(n\)次!),\(blk_l\)什么時候相同?在同一塊里面\(blk_i\)相同。對於每一個塊,排序執行了第二關鍵字: \(r\)。所以這里面的\(r\)是單調遞增的,所以枚舉完一個塊,\(r\)最多移動n次。總共有\(\frac{n}{unit}\)個塊:復雜度為:\(O(\frac{n^2}{unit})\)
總結:\(O(n\cdot unit+\frac{n^2}{unit})\)(\(n,m\)同級,就統一使用\(n\))
根據基本不等式得:當\(unit=\sqrt n\)時,得到莫隊算法的真正復雜度:\(O(n\sqrt n)\)
然后除此以外莫隊還有一個更加NB的常數優化,即在cmp時寫成:
return blk[a.l]<blk[b.l]||(blk[a.l]==blk[b.l]&&(blk[a.l]&1?a.r<b.r:a.r>b.r));
其實也很好理解吧,當左端點同塊時判斷一下當前快編號的奇偶性,盡量讓右端點波動范圍較小(類似波浪形)
經典板子題——區間不同元素個數
板子題參考:SPOJ D-query
大致題意:給定一個數組,每次詢問一個區間內有多少不同的元素
很簡單的莫隊板子題,對於每一次加入新的數時都判斷一下這個數之前是否出現過即可,刪除時同理。
別忘記離散化,CODE
#include<cstdio>
#include<cctype>
#include<cmath>
#include<algorithm>
using namespace std;
const int N=30005,M=200005;
struct data
{
int l,r,ans,id;
}q[M];
int a[N],b[N],n,m,size,tot,blk[N],res,L,R,cnt[N];
inline char tc(void)
{
static char fl[100000],*A=fl,*B=fl;
return A==B&&(B=(A=fl)+fread(fl,1,100000,stdin),A==B)?EOF:*A++;
}
inline void read(int &x)
{
x=0; char ch; while (!isdigit(ch=tc()));
while (x=(x<<3)+(x<<1)+ch-'0',isdigit(ch=tc()));
}
inline void write(int x)
{
if (x>9) write(x/10);
putchar(x%10+'0');
}
inline bool cmp1(data a,data b)
{
return blk[a.l]<blk[b.l]||(blk[a.l]==blk[b.l]&&(blk[a.l]&1?a.r<b.r:a.r>b.r));
}
inline bool cmp2(data a,data b)
{
return a.id<b.id;
}
inline int find(int x)
{
int l=1,r=tot,mid;
while (l<=r)
{
mid=l+r>>1; if (b[mid]==x) return mid;
if (b[mid]<x) l=mid+1; else r=mid-1;
}
}
inline void add(int col)
{
if (++cnt[col]==1) ++res;
}
inline void del(int col)
{
if (--cnt[col]==0) --res;
}
int main()
{
//freopen("CODE.in","r",stdin); freopen("CODE.out","w",stdout);
register int i; read(n); size=sqrt(n);
for (i=1;i<=n;++i) read(a[i]),b[i]=a[i],blk[i]=(i-1)/size+1;
sort(b+1,b+n+1); tot=unique(b+1,b+n+1)-b-1;
for (i=1;i<=n;++i) a[i]=find(a[i]);
for (read(m),i=1;i<=m;++i) read(q[i].l),read(q[i].r),q[i].id=i;
sort(q+1,q+m+1,cmp1); L=q[1].l; R=q[1].r;
for (i=L;i<=R;++i) add(a[i]); q[1].ans=res;
for (i=2;i<=m;++i)
{
while (L>q[i].l) add(a[--L]); while (L<q[i].l) del(a[L++]);
while (R<q[i].r) add(a[++R]); while (R>q[i].r) del(a[R--]);
q[i].ans=res;
}
for (sort(q+1,q+m+1,cmp2),i=1;i<=m;++i) write(q[i].ans),putchar('\n');
return 0;
}