這個算法有點難度,一般比較標准的描述網頁上也有相關的描述,我在這里就簡單的用十分通俗的語言給大家入個門
主要可以結合https://blog.csdn.net/zsfcg/article/details/20738027這一篇來理解
首先要理解一些基本概念,看圖
所謂匹配,就是不相鄰的邊的集合
最大匹配,就是這些集合中,邊數最多的那個集合
如果某一個匹配中所有的邊的兩個端點包含了圖上所有的點,就是完美匹配。
|N(S)|或者|X|或|Y|表示的是相應集合的元素的個數。
N(S)表示與S集合中的頂點相鄰接的頂點,例如,A-B-C-D中,B的鄰接點就是A和C。
A-B-C-D是一條增廣路,紅色線表示屬於M匹配,黑色線表示不屬於,圖中,B,C兩點是M飽和的,A,D兩點是非M飽和的。
交替路故名思意就是交互替錯的邊,三條連續的邊一個是匹配然后一個不是再下一個又是了
擴展路(增廣路)可以理解為不是兩個端點都在里面,所有的邊里面有一些只有一個端點,也就是不飽和。
下面給出這個算法的步驟理解
上面這個算法只是針對飽和X的,意思就是,如果X中的每個頂點都已匹配上,那么算法終止,而不必管Y中的頂點是否都有匹配。
圓圈里面一個加號的運算其實可以簡單理解為增廣路的取反,所謂取反就是把屬於M匹配的邊變成不屬於M的邊,把不屬於M的邊變為屬於M的邊,在那個A-B-C-D的增廣路的圖例中就是把A-B和C-D邊變成紅色而把B-C邊變成黑色。這樣做一個明顯的作用就是匹配的邊數增多了一條!
我的理解是,這個算法的最終目的就是輸出一個匹配,而其中所有X的端點必須全部包含在里面,
1、首先的前提必須是X比Y的個數要少,
2、然后取一個匹配出來看是不是飽和,是飽和就直接輸出,不是的話取一個不飽和的端點放到S中,定義一個T空集合
3、看S中的端點是不是都在T里面,是的話就停止,不是的話S集合中的頂點相鄰接的頂點(也就是N(s))去掉T中的點,再從中選一個點y
4、接下來看這個y,看它是不是飽和的
如果是飽和就把它對應的那個飽和的端點z放到S中,把y放到T當中,跳到第三步這里檢查;
如果不是飽和,那這個時候有一個點x和它組成了增廣路xy,反向選擇它兩邊的路(在上面的實例圖中就相當於A-B和C-D邊變成紅色而把B-C邊變成黑色,明顯的作用就是增多了一條匹配的邊數),然后跳轉到第二步。
所以總結一下的話,可以理解為它不斷創造條件得到一個包含所有X端點的匹配,如果一開始沒有找到,就先從圖中找一個沒有飽和的點,把它的另一個點加進來,然后看還有沒有飽和的可能性),沒有就把那條路的相鄰的邊加進來(就相當於這個邊刪掉,取它)
網頁里面這個ppt的例子很直觀,理解完上面的以后再看這個就很簡單了
再次提一下N(S)表示與S集合中的頂點相鄰接的頂點,而T其實是存放的計算過程中飽和的點
抽象的說,是我們在X這邊保存了已經訪問過的點S,在Y這邊類似有T,從u點開始S和T都不斷增大,每次只增大1,增大
的規則是u的鄰接點y如果已經匹配z,就把y加到T,z加到S,下一步的操作,是換個u, 再將T中沒有訪問過的點再次考查
一遍。如果y沒有匹配,那正好,根據你的訪問規則,這個時候u和y肯定可以配對的,這樣就可以增加配對了。
我們的工作是為了讓配對的個數越來越多,直到最后不能再配對。不能配對的判定就是Hall定理,S的鄰接點剛好是T。
以上就是匈牙利算法的基本步驟和計算過程了
下面來看看求二部圖最大匹配的匈牙利算法,就是不管X還是Y,我們求得是含匹配邊最多的匹配
一般的,我們會這樣取頂點標號的值:l(y)全部賦值為0,而l(x)取得是和頂點x相鄰接的所有的點之間的權重的最大值。下面有個例子用的就是這個方法。
“圖G的平凡標號”那個圖上X集中的各頂點上的數字5,2,4,1就是頂點標號,Y集中的頂點標號全為0。
這里仔細看一下的話5241就是所有的和這個端點相連的路中權重最大的值,然后把這些權重對應的路都找出來,就是相等子圖咯
上面這個修改標號的過程是KM算法區別於匈牙利算法的地方。修改的目的是在目前找到的M匹配的基礎上增加可行頂點,從而得到增廣路。
這是我在寫這篇翻閱的一些網站,特此感謝
http://www.bubuko.com/infodetail-2136960.html
https://blog.csdn.net/zsfcg/article/details/20738027
https://www.cnblogs.com/kuangbin/archive/2012/08/19/2646535.html(matlab的實現)
python代碼實現的官網:https://pypi.org/project/munkres/1.0.5.4/
摘抄的一些零散的總結幫助大家理解
[二分圖帶權匹配與最佳匹配]
什么是二分圖的帶權匹配?二分圖的帶權匹配就是求出一個匹配集合,使得集合中邊的權值之和最大或最小。而二分圖的最佳匹配則一定為完備匹配,在此基礎上,才要求匹配的邊權值之和最大或最小。二分圖的帶權匹配與最佳匹配不等價,也不互相包含。
這兩個的關系比較懸乎。我的理解就是帶權匹配是不考慮是不是完備,只求最大或最小權匹配。而最佳匹配則必須在完備匹配的基礎上找最大或最小權匹配。
這兩個還是結合具體題目比較好理解些。
KM算法是求最大權完備匹配,如果要求最小權完備匹配怎么辦?方法很簡單,只需將所有的邊權值取其相反數,求最大權完備匹配,匹配的值再取相反數即可。
KM算法的運行要求是必須存在一個完備匹配,如果求一個最大權匹配(不一定完備)該如何辦?依然很簡單,把不存在的邊權值賦為0。
KM算法求得的最大權匹配是邊權值和最大,如果我想要邊權之積最大,又怎樣轉化?還是不難辦到,每條邊權取自然對數,然后求最大和權匹配,求得的結果a再算出e^a就是最大積匹配。至於精度問題則沒有更好的辦法了。
二分圖最優匹配:對於二分圖的每條邊都有一個權(非負),要求一種完備匹配方案,使得所有匹配邊的權和最大,記做最優完備匹配。(特殊的,當所有邊的權為1時,就是最大完備匹配問題)
定義 設G=<V1,V2,E>為二部圖,|V1|≤|V2|,M為G中一個最大匹配,且|M|=|V1|,則稱M為V1到V2的完備匹配。
在上述定義中,若|V2|=|V1|,則完備匹配即為完美匹配,若|V1|<|V2|,則完備匹配為G中最大匹配。
KM算法是通過給每個頂點一個標號(叫做頂標)來把求最大權匹配的問題轉化為求完備匹配的問題的。設頂點Xi的頂標為A[i],頂點Yi的頂標為B[i],頂點Xi與Yj之間的邊權為w[i,j]。在算法執行過程中的任一時刻,對於任一條邊(i,j),A[i]+B[j]>=w[i,j]始終成立,初始A[i]為與xi相連的邊的最大邊權,B[j]=0。KM算法的正確性基於以下定理:
若由二分圖中所有滿足A[i]+B[j]=w[i,j]的邊(i,j)構成的子圖(稱做相等子圖)有完備匹配,那么這個完備匹配就是二分圖的最大權匹配。
因為對於二分圖的任意一個匹配,如果它包含於相等子圖,那么它的邊權和等於所有頂點的頂標和;如果它有的邊不包含於相等子圖,那么它的邊權和小於所有頂點的頂標和(即不是最優匹配)。所以相等子圖的完備匹配一定是二分圖的最大權匹配。
該算法是通過給每個頂點一個標號(叫做頂標)來把求最大權匹配的問題轉化為求完備匹配的問題的。設頂點Xi的頂標為A[ i ],頂點Yj的頂標為B[ j ],頂點Xi與Yj之間的邊權為w[i,j]。在算法執行過程中的任一時刻,對於任一條邊(i,j),A[ i ]+B[j]>=w[i,j]始終成立。
KM算法的正確性基於以下定理:
若由二分圖中所有滿足A[ i ]+B[j]=w[i,j]的邊(i,j)構成的子圖(稱做相等子圖)有完備匹配,那么這個完備匹配就是二分圖的最大權匹配。
首先解釋下什么是完備匹配,所謂的完備匹配就是在二部圖中,X點集中的所有點都有對應的匹配或者是
Y點集中所有的點都有對應的匹配,則稱該匹配為完備匹配。
這個定理是顯然的。因為對於二分圖的任意一個匹配,如果它包含於相等子圖,那么它的邊權和等於所有頂點的頂標和;如果它有的邊不包含於相等子圖,那么它的邊權和小於所有頂點的頂標和。所以相等子圖的完備匹配一定是二分圖的最大權匹配。
初始時為了使A[ i ]+B[j]>=w[i,j]恆成立,令A[ i ]為所有與頂點Xi關聯的邊的最大權,B[j]=0。如果當前的相等子圖沒有完備匹配,就按下面的方法修改頂標以使擴大相等子圖,直到相等子圖具有完備匹配為止。
我們求當前相等子圖的完備匹配失敗了,是因為對於某個X頂點,我們找不到一條從它出發的交錯路。這時我們獲得了一棵交錯樹,它的葉子結點全部是X頂點。現在我們把交錯樹中X頂點的頂標全都減小某個值d,Y頂點的頂標全都增加同一個值d,那么我們會發現:
1)兩端都在交錯樹中的邊(i,j),A[ i ]+B[j]的值沒有變化。也就是說,它原來屬於相等子圖,現在仍屬於相等子圖。
2)兩端都不在交錯樹中的邊(i,j),A[ i ]和B[j]都沒有變化。也就是說,它原來屬於(或不屬於)相等子圖,現在仍屬於(或不屬於)相等子圖。
3)X端不在交錯樹中,Y端在交錯樹中的邊(i,j),它的A[ i ]+B[j]的值有所增大。它原來不屬於相等子圖,現在仍不屬於相等子圖。
4)X端在交錯樹中,Y端不在交錯樹中的邊(i,j),它的A[ i ]+B[j]的值有所減小。也就說,它原來不屬於相等子圖,現在可能進入了相等子圖,因而使相等子圖得到了擴大。
現在的問題就是求d值了。為了使A[ i ]+B[j]>=w[i,j]始終成立,且至少有一條邊進入相等子圖,d應該等於:
Min{A[ i ]+B[j]-w[i,j] | Xi在交錯樹中,Yi不在交錯樹中}。 以上就是KM算法的基本思路。但是朴素的實現方法,時間復雜度為O(n4)——需要找O(n)次增廣路,每次增廣最多需要修改O(n)次頂標,每次修改頂標時由於要枚舉邊來求d值,復雜度為O(n2)。實際上KM算法的復雜度是可以做到O(n3)的。我們給每個Y頂點一個“松弛量”函數slack,每次開始找增廣路時初始化為無窮大。在尋找增廣路的過程中,檢查邊(i,j)時,如果它不在相等子圖中,則讓slack[j]變成原值與A[ i ]+B[j]-w[i,j]的較小值。這樣,在修改頂標時,取所有不在交錯樹中的Y頂點的slack值中的最小值作為d值即可。但還要注意一點:修改頂標后,要把所有的不在交錯樹中的Y頂點的slack值都減去d。
Kuhn-Munkras算法流程:
(1)初始化可行頂標的值
(2)用匈牙利算法尋找完備匹配
(3)若未找到完備匹配則修改可行頂標的值
(4)重復(2)(3)直到找到相等子圖的完備匹配為止
最后還是強調一點:
KM算法用來解決最大權匹配問題: 在一個二分圖內,左頂點為X,右頂點為Y,現對於每組左右連接XiYj有權wij,求一種匹配使得所有wij的和最大。
也就是最大權匹配一定是完備匹配。如果兩邊的點數相等則是完美匹配。
如果點數不相等,其實可以虛擬一些點,使得點數相等,也成為了完美匹配。
最大權匹配還可以用最大流去解決。。。