Louvain 算法原理

本文轉載自查看原文 2019-03-02 16:12 2307 數據分析算法/ 大數據算法學習

Louvain算法是一種基於圖數據的社區發現算法，算法的優化目標為最大化整個數據的模塊度，模塊度的計算如下：

其中m為圖中邊的總數量，k_i表示所有指向節點i的連邊權重之和，k_j同理。A_{i,j} 表示節點i，j之間的連邊權重。有一點要搞清楚，模塊度的概念不是Louvain算法發明的，而Louvain算法只是一種優化關系圖模塊度目標的一種實現而已。

Louvain算法的兩步迭代設計：
最開始，每個原始節點都看成一個獨立的社區，社區內的連邊權重為0.
算法掃描數據中的所有節點，針對每個節點遍歷該節點的所有鄰居節點，衡量把該節點加入其鄰居節點所在的社區所帶來的模塊度的收益。並選擇對應最大收益的鄰居節點，加入其所在的社區。這一過程化重復進行指導每一個節點的社區歸屬都不在發生變化。
對步驟1中形成的社區進行折疊，把每個社區折疊成一個單點，分別計算這些新生成的“社區點”之間的連邊權重，以及社區內的所有點之間的連邊權重之和。用於下一輪的步驟1。
該算法的最大優勢就是速度很快，步驟1的每次迭代的時間復雜度為O(N)，N為輸入數據中的邊的數量。步驟2 的時間復雜度為O(M + N)， M為本輪迭代中點的個數。
迭代過程：

1，假設我們最開始有5個點，互相之間存在一定的關系（至於什么關系，先不管），如下：

2. 假設在進過了步驟1的充分迭代之后發現節點2，應該加入到節點1所在的社區（最開始每個點都是一個社區，而自己就是這個社區的代表），新的社區由節點1代表，如下：

此時節點3，4，5之間以及與節點1，2之間沒有任何歸屬關系。

3. 此時應該執行步驟2，將節點1，2組合成的新社區進行折疊，折疊之后的社區看成一個單點，用節點1來代表，如下：

此時數據中共有4個節點（或者說4個社區），其中一個社區包含了兩個節點，而社區3，4，5都只包含一個節點，即他們自己。

4. 重新執行步驟1，對社區1，3，4，5進行掃描，假設在充分迭代之后節點5，4，3分別先后都加入了節點1所在的社區，如下：

5. 進行步驟2，對新生成的社區進行折疊，新折疊而成的社區看成一個單點，由節點1代表，結構如下：

此時由於整個數據中只剩下1個社區，即由節點1代表的社區。再進行步驟1時不會有任何一個節點的社區歸屬發生變化，此時也就不需要再執行步驟2，至此，迭代結束。

轉自: https://blog.csdn.net/xsqlx/article/details/79078867

免責聲明！

本站轉載的文章為個人學習借鑒使用，本站對版權不負任何法律責任。如果侵犯了您的隱私權益，請聯系本站郵箱yoyou2525@163.com刪除。

猜您在找 Louvain社區發現算法模塊度與Louvain社區發現算法模塊度與Louvain社區發現算法並行計算：並行Louvain社區檢測算法 Louvain 論文筆記 COMMUNITY DETECTION_python-louvain BIRCH聚類算法原理 TCP協議、算法和原理 PID控制原理和算法常見hash算法的原理