最近公共祖先LCA(Tarjan算法)的思考和算法實現


LCA 最近公共祖先

Tarjan(離線)算法的基本思路及其算法實現

                              小廣告:METO CODE 安溪一中信息學在線評測系統(OJ)

      //由於這是第一篇博客..有點瑕疵...比如我把false寫成了flase...看的時候注意一下!

      //還有...這篇字比較多 比較雜....畢竟是第一次嘛 將就將就 后面會重新改!!!

    首先是最近公共祖先的概念(什么是最近公共祖先?):

    在一棵沒有環的樹上,每個節點肯定有其父親節點和祖先節點,而最近公共祖先,就是兩個節點在這棵樹上深度最大公共祖先節點

    換句話說,就是兩個點在這棵樹上距離最近的公共祖先節點

    所以LCA主要是用來處理當兩個點僅有唯一一條確定的最短路徑時的路徑。

    有人可能會問:那他本身或者其父親節點是否可以作為祖先節點呢?

    答案是肯定的,很簡單,按照人的親戚觀念來說,你的父親也是你的祖先,而LCA還可以將自己視為祖先節點

    舉個例子吧,如下圖所示最近公共祖先是2最近公共祖先最近公共祖先 

    這就是最近公共祖先的基本概念了,那么我們該如何去求這個最近公共祖先呢?

    通常初學者都會想到最簡單粗暴的一個辦法:對於每個詢問,遍歷所有的點,時間復雜度為O(n*q),很明顯,n和q一般不會很小

    常用的求LCA的算法有:Tarjan/DFS+ST/倍增

    后兩個算法都是在線算法,也很相似,時間復雜度在O(logn)~O(nlogn)之間,我個人認為較難理解。

    有的題目是可以用線段樹來做的,但是其代碼量很大,時間復雜度也偏高,在O(n)~O(nlogn)之間,優點在於也是簡單粗暴

    這篇博客主要是要介紹一下Tarjan算法(其實是我不會在線...)。

    什么是Tarjan(離線)算法呢?顧名思義,就是在一次遍歷中把所有詢問一次性解決,所以其時間復雜度是O(n+q)

    Tarjan算法的優點在於相對穩定,時間復雜度也比較居中,也很容易理解。

    下面詳細介紹一下Tarjan算法的基本思路:

      1.任選一個點為根節點,從根節點開始。

      2.遍歷該點u所有子節點v,並標記這些子節點v已被訪問過。

      3.若是v還有子節點,返回2,否則下一步。

      4.合並v到u上。

      5.尋找與當前點u有詢問關系的點v。

      6.若是v已經被訪問過了,則可以確認u和v的最近公共祖先為v被合並到的父親節點a。

    遍歷的話需要用到dfs來遍歷(我相信來看的人都懂吧...),至於合並,最優化的方式就是利用並查集來合並兩個節點。

    下面上偽代碼:

   1 Tarjan(u)//marge和find為並查集合並函數和查找函數
   2 {    3     for each(u,v)    //訪問所有u子節點v
   4  {    5         Tarjan(v);        //繼續往下遍歷
   6         marge(u,v);    //合並v到u上
   7  標記v被訪問過;    8  }    9     for each(u,e)    //訪問所有和u有詢問關系的e
  10  {   11  如果e被訪問過;   12  u,e的最近公共祖先為find(e);   13  }   14 }

    個人感覺這樣還是有很多人不太理解,所以我打算模擬一遍給大家看。

    建議拿着紙和筆跟着我的描述一起模擬!!

    假設我們有一組數據 9個節點 8條邊 聯通情況如下:

    1--2,1--3,2--4,2--5,3--6,5--7,5--8,7--9 即下圖所示的樹

    設我們要查找最近公共祖先的點為9--8,4--6,7--5,5--3;

    設f[]數組為並查集的父親節點數組,初始化f[i]=i,vis[]數組為是否訪問過的數組,初始為0; 

    下面開始模擬過程:

    取1為根節點往下搜索發現有兩個兒子2和3;

    先搜2,發現2有兩個兒子4和5,先搜索4,發現4沒有子節點,則尋找與其有關系的點;

    發現6與4有關系,但是vis[6]=0,即6還沒被搜過,所以不操作

    發現沒有和4有詢問關系的點了,返回此前一次搜索,更新vis[4]=1

    

    表示4已經被搜完,更新f[4]=2,繼續搜5,發現5有兩個兒子7和8;

    先搜7,發現7有一個子節點9,搜索9,發現沒有子節點,尋找與其有關系的點;

    發現8和9有關系,但是vis[8]=0,即8沒被搜到過,所以不操作;

    發現沒有和9有詢問關系的點了,返回此前一次搜索,更新vis[9]=1

    表示9已經被搜完,更新f[9]=7,發現7沒有沒被搜過的子節點了,尋找與其有關系的點;

    發現5和7有關系,但是vis[5]=0,所以不操作

    發現沒有和7有關系的點了,返回此前一次搜索,更新vis[7]=1

    

    表示7已經被搜完,更新f[7]=5,繼續搜8發現8沒有子節點,則尋找與其有關系的點;

    發現9與8有關系,此時vis[9]=1,則他們的最近公共祖先find(9)=5

      (find(9)的順序為f[9]=7-->f[7]=5-->f[5]=5 return 5;)

    發現沒有與8有關系的點了,返回此前一次搜索,更新vis[8]=1

 

    表示8已經被搜完,更新f[8]=5,發現5沒有沒搜過的子節點了,尋找與其有關系的點;

    

    發現7和5有關系,此時vis[7]=1,所以他們的最近公共祖先find(7)=5

      (find(7)的順序為f[7]=5-->f[5]=5 return 5;)

    又發現5和3有關系,但是vis[3]=0,所以不操作,此時5的子節點全部搜完了;

    返回此前一次搜索,更新vis[5]=1,表示5已經被搜完,更新f[5]=2

    發現2沒有未被搜完的子節點,尋找與其有關系的點;

    又發現沒有和2有關系的點,則此前一次搜索,更新vis[2]=1

    

    表示2已經被搜完,更新f[2]=1,繼續搜3,發現3有一個子節點6;

    搜索6,發現6沒有子節點,則尋找與6有關系的點,發現4和6有關系;

    此時vis[4]=1,所以它們的最近公共祖先find(4)=1;

      (find(4)的順序為f[4]=2-->f[2]=2-->f[1]=1 return 1;)

    發現沒有與6有關系的點了,返回此前一次搜索,更新vis[6]=1,表示6已經被搜完了;

    

    更新f[6]=3,發現3沒有沒被搜過的子節點了,則尋找與3有關系的點;

    發現5和3有關系,此時vis[5]=1,則它們的最近公共祖先find(5)=1

      (find(5)的順序為f[5]=2-->f[2]=1-->f[1]=1 return 1;)

    發現沒有和3有關系的點了,返回此前一次搜索,更新vis[3]=1

    

    更新f[3]=1,發現1沒有被搜過的子節點也沒有有關系的點,此時可以退出整個dfs了。

    經過這次dfs我們得出了所有的答案,有沒有覺得很神奇呢?是否對Tarjan算法有更深層次的理解了呢?

    

    如果有什么不懂可以在下面 留言提問 or 發送問題到1136404654@qq.com。

    推薦幾道LCA的題目

          CODEVS 2370 小機房的樹 傳送門

          CODEVS 1036 商務旅行 傳送門

          METO CODE 223 拉力賽 傳送門

          HDU 2586 How far way? 傳送門

          ZOJ 3195 Design the city 傳送門

    相應的題解以后可能會上,大家敬請期待吧。


免責聲明!

本站轉載的文章為個人學習借鑒使用,本站對版權不負任何法律責任。如果侵犯了您的隱私權益,請聯系本站郵箱yoyou2525@163.com刪除。



 
粵ICP備18138465號   © 2018-2025 CODEPRJ.COM