匈牙利算法(Kuhn-Munkres)算法

本文轉載自查看原文 2019-02-18 21:15 2394 PYTHON基礎及算法

這個算法有點難度，一般比較標准的描述網頁上也有相關的描述，我在這里就簡單的用十分通俗的語言給大家入個門

主要可以結合https://blog.csdn.net/zsfcg/article/details/20738027這一篇來理解

首先要理解一些基本概念，看圖

所謂匹配，就是不相鄰的邊的集合

最大匹配，就是這些集合中，邊數最多的那個集合

如果某一個匹配中所有的邊的兩個端點包含了圖上所有的點，就是完美匹配。

|N(S)|或者|X|或|Y|表示的是相應集合的元素的個數。

N(S)表示與S集合中的頂點相鄰接的頂點，例如，A-B-C-D中，B的鄰接點就是A和C。

A-B-C-D是一條增廣路，紅色線表示屬於M匹配，黑色線表示不屬於，圖中，B，C兩點是M飽和的，A,D兩點是非M飽和的。

交替路故名思意就是交互替錯的邊，三條連續的邊一個是匹配然后一個不是再下一個又是了

擴展路（增廣路）可以理解為不是兩個端點都在里面，所有的邊里面有一些只有一個端點，也就是不飽和。

下面給出這個算法的步驟理解

上面這個算法只是針對飽和X的，意思就是，如果X中的每個頂點都已匹配上，那么算法終止，而不必管Y中的頂點是否都有匹配。

圓圈里面一個加號的運算其實可以簡單理解為增廣路的取反，所謂取反就是把屬於M匹配的邊變成不屬於M的邊，把不屬於M的邊變為屬於M的邊，在那個A-B-C-D的增廣路的圖例中就是把A-B和C-D邊變成紅色而把B-C邊變成黑色。這樣做一個明顯的作用就是匹配的邊數增多了一條！

我的理解是，這個算法的最終目的就是輸出一個匹配，而其中所有X的端點必須全部包含在里面，

1、首先的前提必須是X比Y的個數要少，

2、然后取一個匹配出來看是不是飽和，是飽和就直接輸出，不是的話取一個不飽和的端點放到S中，定義一個T空集合

3、看S中的端點是不是都在T里面，是的話就停止，不是的話S集合中的頂點相鄰接的頂點(也就是N（s）)去掉T中的點，再從中選一個點y

4、接下來看這個y，看它是不是飽和的

如果是飽和就把它對應的那個飽和的端點z放到S中，把y放到T當中，跳到第三步這里檢查；

如果不是飽和，那這個時候有一個點x和它組成了增廣路xy，反向選擇它兩邊的路（在上面的實例圖中就相當於A-B和C-D邊變成紅色而把B-C邊變成黑色，明顯的作用就是增多了一條匹配的邊數），然后跳轉到第二步。

所以總結一下的話，可以理解為它不斷創造條件得到一個包含所有X端點的匹配，如果一開始沒有找到，就先從圖中找一個沒有飽和的點，把它的另一個點加進來，然后看還有沒有飽和的可能性），沒有就把那條路的相鄰的邊加進來（就相當於這個邊刪掉，取它）

網頁里面這個ppt的例子很直觀，理解完上面的以后再看這個就很簡單了

再次提一下N(S)表示與S集合中的頂點相鄰接的頂點，而T其實是存放的計算過程中飽和的點

抽象的說，是我們在X這邊保存了已經訪問過的點S,在Y這邊類似有T，從u點開始S和T都不斷增大，每次只增大1,增大

的規則是u的鄰接點y如果已經匹配z，就把y加到T，z加到S，下一步的操作，是換個u, 再將T中沒有訪問過的點再次考查

一遍。如果y沒有匹配，那正好，根據你的訪問規則，這個時候u和y肯定可以配對的，這樣就可以增加配對了。

我們的工作是為了讓配對的個數越來越多，直到最后不能再配對。不能配對的判定就是Hall定理,S的鄰接點剛好是T。

以上就是匈牙利算法的基本步驟和計算過程了

下面來看看求二部圖最大匹配的匈牙利算法，就是不管X還是Y，我們求得是含匹配邊最多的匹配

一般的，我們會這樣取頂點標號的值：l(y)全部賦值為0，而l(x)取得是和頂點x相鄰接的所有的點之間的權重的最大值。下面有個例子用的就是這個方法。

“圖G的平凡標號”那個圖上X集中的各頂點上的數字5,2,4,1就是頂點標號，Y集中的頂點標號全為0。

這里仔細看一下的話5241就是所有的和這個端點相連的路中權重最大的值，然后把這些權重對應的路都找出來，就是相等子圖咯

上面這個修改標號的過程是KM算法區別於匈牙利算法的地方。修改的目的是在目前找到的M匹配的基礎上增加可行頂點，從而得到增廣路。

這是我在寫這篇翻閱的一些網站，特此感謝

http://www.bubuko.com/infodetail-2136960.html

https://blog.csdn.net/zsfcg/article/details/20738027

https://www.cnblogs.com/kuangbin/archive/2012/08/19/2646535.html（matlab的實現）

python代碼實現的官網：https://pypi.org/project/munkres/1.0.5.4/

摘抄的一些零散的總結幫助大家理解

[二分圖帶權匹配與最佳匹配]

什么是二分圖的帶權匹配？二分圖的帶權匹配就是求出一個匹配集合，使得集合中邊的權值之和最大或最小。而二分圖的最佳匹配則一定為完備匹配，在此基礎上，才要求匹配的邊權值之和最大或最小。二分圖的帶權匹配與最佳匹配不等價，也不互相包含。

這兩個的關系比較懸乎。我的理解就是帶權匹配是不考慮是不是完備，只求最大或最小權匹配。而最佳匹配則必須在完備匹配的基礎上找最大或最小權匹配。

這兩個還是結合具體題目比較好理解些。

KM算法是求最大權完備匹配，如果要求最小權完備匹配怎么辦？方法很簡單，只需將所有的邊權值取其相反數，求最大權完備匹配，匹配的值再取相反數即可。

KM算法的運行要求是必須存在一個完備匹配，如果求一個最大權匹配(不一定完備)該如何辦？依然很簡單，把不存在的邊權值賦為0。

KM算法求得的最大權匹配是邊權值和最大，如果我想要邊權之積最大，又怎樣轉化？還是不難辦到，每條邊權取自然對數，然后求最大和權匹配，求得的結果a再算出e^a就是最大積匹配。至於精度問題則沒有更好的辦法了。

二分圖最優匹配：對於二分圖的每條邊都有一個權（非負），要求一種完備匹配方案，使得所有匹配邊的權和最大，記做最優完備匹配。（特殊的，當所有邊的權為1時，就是最大完備匹配問題）

定義設G＝<V₁，V₂，E>為二部圖，|V₁|≤|V₂|，M為G中一個最大匹配，且|M|＝|V₁|，則稱M為V₁到V₂的完備匹配。

在上述定義中，若|V₂|＝|V₁|，則完備匹配即為完美匹配，若|V₁|<|V₂|，則完備匹配為G中最大匹配。

KM算法是通過給每個頂點一個標號（叫做頂標）來把求最大權匹配的問題轉化為求完備匹配的問題的。設頂點X_i的頂標為A[i]，頂點Y_i的頂標為B[i]，頂點X_i與Y_j之間的邊權為w[i,j]。在算法執行過程中的任一時刻，對於任一條邊(i,j)，A[i]+B[j]>=w[i,j]始終成立，初始A[i]為與xi相連的邊的最大邊權，B[j]=0。KM算法的正確性基於以下定理：

設 G(V,E) 為二部圖， G'(V,E') 為二部圖的子圖。如果對於 G' 中的任何邊<x,y> 滿足， L(x)+ L(y)== W _x,y，我們稱 G'(V,E') 為 G(V,E) 的等價子圖或相等子圖（是G的生成子圖）。

若由二分圖中所有滿足A[i]+B[j]=w[i,j]的邊(i,j)構成的子圖（稱做相等子圖）有完備匹配，那么這個完備匹配就是二分圖的最大權匹配。

因為對於二分圖的任意一個匹配，如果它包含於相等子圖，那么它的邊權和等於所有頂點的頂標和；如果它有的邊不包含於相等子圖，那么它的邊權和小於所有頂點的頂標和（即不是最優匹配）。所以相等子圖的完備匹配一定是二分圖的最大權匹配。

該算法是通過給每個頂點一個標號（叫做頂標）來把求最大權匹配的問題轉化為求完備匹配的問題的。設頂點Xi的頂標為A[ i ]，頂點Yj的頂標為B[ j ]，頂點Xi與Yj之間的邊權為w[i,j]。在算法執行過程中的任一時刻，對於任一條邊(i,j)，A[ i ]+B[j]>=w[i,j]始終成立。

　　KM算法的正確性基於以下定理：

　　若由二分圖中所有滿足A[ i ]+B[j]=w[i,j]的邊(i,j)構成的子圖（稱做相等子圖）有完備匹配，那么這個完備匹配就是二分圖的最大權匹配。

　　首先解釋下什么是完備匹配，所謂的完備匹配就是在二部圖中，X點集中的所有點都有對應的匹配或者是

　　Y點集中所有的點都有對應的匹配，則稱該匹配為完備匹配。

　　這個定理是顯然的。因為對於二分圖的任意一個匹配，如果它包含於相等子圖，那么它的邊權和等於所有頂點的頂標和；如果它有的邊不包含於相等子圖，那么它的邊權和小於所有頂點的頂標和。所以相等子圖的完備匹配一定是二分圖的最大權匹配。

　　初始時為了使A[ i ]+B[j]>=w[i,j]恆成立，令A[ i ]為所有與頂點Xi關聯的邊的最大權，B[j]=0。如果當前的相等子圖沒有完備匹配，就按下面的方法修改頂標以使擴大相等子圖，直到相等子圖具有完備匹配為止。

　　我們求當前相等子圖的完備匹配失敗了，是因為對於某個X頂點，我們找不到一條從它出發的交錯路。這時我們獲得了一棵交錯樹，它的葉子結點全部是X頂點。現在我們把交錯樹中X頂點的頂標全都減小某個值d，Y頂點的頂標全都增加同一個值d，那么我們會發現：

　　1）兩端都在交錯樹中的邊(i,j)，A[ i ]+B[j]的值沒有變化。也就是說，它原來屬於相等子圖，現在仍屬於相等子圖。

　　2）兩端都不在交錯樹中的邊(i,j)，A[ i ]和B[j]都沒有變化。也就是說，它原來屬於（或不屬於）相等子圖，現在仍屬於（或不屬於）相等子圖。

　　3）X端不在交錯樹中，Y端在交錯樹中的邊(i,j)，它的A[ i ]+B[j]的值有所增大。它原來不屬於相等子圖，現在仍不屬於相等子圖。

　　4）X端在交錯樹中，Y端不在交錯樹中的邊(i,j)，它的A[ i ]+B[j]的值有所減小。也就說，它原來不屬於相等子圖，現在可能進入了相等子圖，因而使相等子圖得到了擴大。

　　現在的問題就是求d值了。為了使A[ i ]+B[j]>=w[i,j]始終成立，且至少有一條邊進入相等子圖，d應該等於：

　　Min{A[ i ]+B[j]-w[i,j] | Xi在交錯樹中，Yi不在交錯樹中}。　　以上就是KM算法的基本思路。但是朴素的實現方法，時間復雜度為O(n4)——需要找O(n)次增廣路，每次增廣最多需要修改O(n)次頂標，每次修改頂標時由於要枚舉邊來求d值，復雜度為O(n2)。實際上KM算法的復雜度是可以做到O(n3)的。我們給每個Y頂點一個“松弛量”函數slack，每次開始找增廣路時初始化為無窮大。在尋找增廣路的過程中，檢查邊(i,j)時，如果它不在相等子圖中，則讓slack[j]變成原值與A[ i ]+B[j]-w[i,j]的較小值。這樣，在修改頂標時，取所有不在交錯樹中的Y頂點的slack值中的最小值作為d值即可。但還要注意一點：修改頂標后，要把所有的不在交錯樹中的Y頂點的slack值都減去d。

　　Kuhn－Munkras算法流程：

　　(1)初始化可行頂標的值

　　(2)用匈牙利算法尋找完備匹配

　　(3)若未找到完備匹配則修改可行頂標的值

　　(4)重復(2)(3)直到找到相等子圖的完備匹配為止　

最后還是強調一點：

KM算法用來解決最大權匹配問題：在一個二分圖內，左頂點為X，右頂點為Y，現對於每組左右連接XiYj有權wij，求一種匹配使得所有wij的和最大。

也就是最大權匹配一定是完備匹配。如果兩邊的點數相等則是完美匹配。

如果點數不相等，其實可以虛擬一些點，使得點數相等，也成為了完美匹配。

最大權匹配還可以用最大流去解決。。。

免責聲明！

本站轉載的文章為個人學習借鑒使用，本站對版權不負任何法律責任。如果侵犯了您的隱私權益，請聯系本站郵箱yoyou2525@163.com刪除。

猜您在找 KM(Kuhn-Munkres)算法求帶權二分圖的最佳匹配 Kuhn-Munkres算法（二分圖最大權匹配）匈牙利算法匈牙利算法匈牙利算法匈牙利算法&KM算法算法之匈牙利算法匈牙利算法與KM算法 MATLAB實例：Munkres指派算法匈牙利與KM算法