徹底弄懂最短路徑問題

　　　　　　作者：火星十一郎

　　　　　　出處： http://www.cnblogs.com/hxsyl/

　　　　　　原地址： https://www.cnblogs.com/hxsyl/p/3270401.html#top

只想說：溫故而知新，可以為師矣。我大二的《數據結構》是由申老師講的，那時候不怎么明白，估計太理論化了(ps：或許是因為我睡覺了)；今天把老王的2011年課件又看了一遍，給大二的孩子們又講了一遍，隨手谷歌了N多資料，算是徹底搞懂了最短路徑問題。請讀者盡情享用……

我堅信：沒有不好的學生，只有垃圾的教育。不過沒有人理所當然的對你好，所以要學會感恩。

一.問題引入

問題：從某頂點出發，沿圖的邊到達另一頂點所經過的路徑中，各邊上權值之和最小的一條路徑——最短路徑。解決最短路的問題有以下算法，Dijkstra算法，Bellman-Ford算法，Floyd算法和SPFA算法，另外還有著名的啟發式搜索算法A*，不過A*准備單獨出一篇，其中Floyd算法可以求解任意兩點間的最短路徑的長度。筆者認為任意一個最短路算法都是基於這樣一個事實：從任意節點A到任意節點B的最短路徑不外乎2種可能，1是直接從A到B，2是從A經過若干個節點到B。

二.Dijkstra算法

該算法在《數據結構》課本里是以貪心的形式講解的，不過在《運籌學》教材里被編排在動態規划章節，建議讀者兩篇都看看。

觀察右邊表格發現除最后一個節點外其他均已經求出最短路徑。

(1) 迪傑斯特拉(Dijkstra)算法按路徑長度(看下面表格的最后一行，就是next點)遞增次序產生最短路徑。先把V分成兩組：

S：已求出最短路徑的頂點的集合
V-S=T：尚未確定最短路徑的頂點集合

將T中頂點按最短路徑遞增的次序加入到S中，依據：可以證明V0到T中頂點Vk的最短路徑，或是從V0到Vk的直接路徑的權值或是從V0經S中頂點到Vk的路徑權值之和（反證法可證，說實話，真不明白哦）。

(2) 求最短路徑步驟

初使時令 S={V0},T={其余頂點}，T中頂點對應的距離值，若存在<V0,Vi>，為<V0,Vi>弧上的權值（和ＳＰＦＡ初始化方式不同），若不存在<V0,Vi>，為Inf。
從T中選取一個其距離值為最小的頂點W(貪心體現在此處)，加入S(注意不是直接從S集合中選取，理解這個對於理解vis數組的作用至關重要)，對T中頂點的距離值進行修改：若加進W作中間頂點，從V0到Vi的距離值比不加W的路徑要短，則修改此距離值（上面兩個並列for循環，使用最小點更新）。
重復上述步驟，直到S中包含所有頂點，即S=V為止（說明最外層是除起點外的遍歷）。

下面是上圖的求解過程，按列來看，第一列是初始化過程，最后一行是每次求得的next點。

(3) 問題：Dijkstar能否處理負權邊？（來自《圖論》）

答案是不能，這與貪心選擇性質有關(ps：貌似還是動態規划啊，暈了)，每次都找一個距源點最近的點（dmin），然后將該距離定為這個點到源點的最短路徑；但如果存在負權邊，那就有可能先通過並不是距源點最近的一個次優點（dmin'），再通過這個負權邊L(L<0)，使得路徑之和更小（dmin'+L<dmin）,則dmin'+L成為最短路徑，並不是dmin，這樣dijkstra就被囧掉了。比如n=3，鄰接矩陣：
0，3，4
3，0，-2
4，-2，0,用dijkstra求得d[1，2]=3，事實上d[1，2]=2，就是通過了1-3-2使得路徑減小。不知道講得清楚不清楚。

二.Floyd算法

參考了南陽理工牛帥(目前在新浪)的博客。

Floyd算法的基本思想如下：從任意節點A到任意節點B的最短路徑不外乎2種可能，1是直接從A到B，2是從A經過若干個節點到B，所以，我們假設dist(AB)為節點A到節點B的最短路徑的距離，對於每一個節點K，我們檢查dist(AK) + dist(KB) < dist(AB)是否成立，如果成立，證明從A到K再到B的路徑比A直接到B的路徑短，我們便設置 dist(AB) = dist(AK) + dist(KB)，這樣一來，當我們遍歷完所有節點K，dist(AB)中記錄的便是A到B的最短路徑的距離。

很簡單吧，代碼看起來可能像下面這樣：

for (int i=0; i<n; ++i) {
  for (int j=0; j<n; ++j) {
    for (int k=0; k<n; ++k) {
      if (dist[i][k] + dist[k][j] < dist[i][j] ) {
        dist[i][j] = dist[i][k] + dist[k][j];
      }
    }
  }
}

但是這里我們要注意循環的嵌套順序，如果把檢查所有節點K放在最內層，那么結果將是不正確的，為什么呢？因為這樣便過早的把i到j的最短路徑確定下來了，而當后面存在更短的路徑時，已經不再會更新了。

讓我們來看一個例子，看下圖：

圖中紅色的數字代表邊的權重。如果我們在最內層檢查所有節點K，那么對於A->B，我們只能發現一條路徑，就是A->B，路徑距離為9，而這顯然是不正確的，真實的最短路徑是A->D->C->B，路徑距離為6。造成錯誤的原因就是我們把檢查所有節點K放在最內層，造成過早的把A到B的最短路徑確定下來了，當確定A->B的最短路徑時dist(AC)尚未被計算。所以，我們需要改寫循環順序，如下：

ps：個人覺得，這和銀行家算法判斷安全狀態(每種資源去測試所有線程)，樹狀數組更新(更新所有相關項)一樣的思想。

  for (int i=0; i<n; ++i) {
    for (int j=0; j<n; ++j) {
            /*
            實際中為防止溢出，往往需要選判斷 dist[i][k]和dist[k][j
            都不是Inf ，只要一個是Inf，那么就肯定不必更新。 
            */
      if (dist[i][k] + dist[k][j] < dist[i][j] ) {
        dist[i][j] = dist[i][k] + dist[k][j];
      }
    }
  }
}

如果還是看不懂，那就用草稿紙模擬一遍，之后你就會豁然開朗。半個小時足矣（早知道的話會節省很多個半小時了。。）

再來看路徑保存問題：

void floyd() {
      for(int i=1; i<=n ; i++){
        for(int j=1; j<= n; j++){
          if(map[i][j]==Inf){
               path[i][j] = -1;//表示  i -> j 不通 
          }else{
               path[i][j] = i;// 表示 i -> j 前驅為 i
          }
        }
      }
      for(int k=1; k<=n; k++) {
        for(int i=1; i<=n; i++) {
          for(int j=1; j<=n; j++) {
            if(!(dist[i][k]==Inf||dist[k][j]==Inf)&&dist[i][j] > dist[i][k] + dist[k][j]) {
              dist[i][j] = dist[i][k] + dist[k][j];
              //path[i][k] = i;//刪掉
              path[i][j] = path[k][j];
            }
          }
        }
      }
    }
    void printPath(int from, int to) {
        /*
         * 這是倒序輸出，若想正序可放入棧中，然后輸出。
         * 
         * 這樣的輸出為什么正確呢？個人認為用到了最優子結構性質，
         * 即最短路徑的子路徑仍然是最短路徑
         */
        while(path[from][to]!=from) {
            System.out.print(path[from][to] +"");
            to = path[from][to];
        }
    }

《數據結構》課本上的那種方式我現在還是不想看，看着不舒服……

Floyd算法另一種理解DP，為理論愛好者准備的，上面這個形式的算法其實是Floyd算法的精簡版，而真正的Floyd算法是一種基於DP(Dynamic Programming)的最短路徑算法。設圖G中n 個頂點的編號為1到n。令c [i, j, k]表示從i 到j 的最短路徑的長度，其中k 表示該路徑中的最大頂點，也就是說c[i,j,k]這條最短路徑所通過的中間頂點最大不超過k。因此，如果G中包含邊<i, j>，則c[i, j, 0] =邊<i, j> 的長度；若i= j ，則c[i,j,0]=0；如果G中不包含邊<i, j>，則c (i, j, 0)= +∞。c[i, j, n] 則是從i 到j 的最短路徑的長度。對於任意的k>0，通過分析可以得到：中間頂點不超過k 的i 到j 的最短路徑有兩種可能：該路徑含或不含中間頂點k。若不含，則該路徑長度應為c[i, j, k-1]，否則長度為 c[i, k, k-1] +c [k, j, k-1]。c[i, j, k]可取兩者中的最小值。狀態轉移方程：c[i, j, k]=min{c[i, j, k-1], c [i, k, k-1]+c [k, j, k-1]}，k＞0。這樣，問題便具有了最優子結構性質，可以用動態規划方法來求解。

看另一個DP(直接引用王老師課件)

        說了這么多，相信讀者已經躍躍欲試了，咱們看一道例題，以ZOJ 1092為例：給你一組國家和國家間的部分貨幣匯率兌換表，問你是否存在一種方式，從一種貨幣出發，經過一系列的貨幣兌換，最后返回該貨幣時大於出發時的數值(ps：這就是所謂的投機倒把吧)，下面是一組輸入。
3    //國家數
USDollar //國家名
BritishPound
FrenchFranc
   3    //貨幣兌換數
USDollar 0.5 BritishPound //部分貨幣匯率兌換表
BritishPound 10.0 FrenchFranc
FrenchFranc 0.21 USDollar

月賽做的題，不過當時用的思路是求強連通分量(ps：明明說的，那時我和華傑感覺好有道理)，也沒做出來，現在知道了直接floyd算法就ok了。

思路分析：輸入的時候可以采用Map<String,Integer> map = new HashMap<String,Integer>()主要是為了獲得再次包含匯率輸入時候的下標以建圖(感覺自己寫的好拗口)，或者第一次直接存入String數組str，再次輸入的時候每次遍歷str數組，若是equals那么就把str的下標賦值給該幣種建圖。下面就是floyd算法啦，初始化其它點為-1，對角線為1，采用乘法更新求最大值。

三.Bellman-Ford算法

為了能夠求解邊上帶有負值的單源最短路徑問題，Bellman(貝爾曼，動態規划提出者)和Ford(福特)提出了從源點逐次繞過其他頂點，以縮短到達終點的最短路徑長度的方法。 Bellman-ford算法是求含負權圖的單源最短路徑算法，效率很低，但代碼很容易寫。即進行不停地松弛，每次松弛把每條邊都更新一下，若n-1次松弛后還能更新，則說明圖中有負環，無法得出結果，否則就成功完成。Bellman-ford算法有一個小優化：每次松弛先設一個flag，初值為FALSE，若有邊更新則賦值為TRUE，最終如果還是FALSE則直接成功退出。Bellman-ford算法浪費了許多時間做無必要的松弛，所以SPFA算法用隊列進行了優化，效果十分顯著，高效難以想象。SPFA還有SLF，LLL，滾動數組等優化。

關於SPFA，請看我這一篇http://www.cnblogs.com/hxsyl/p/3248391.html

遞推公式(求頂點u到源點v的最短路徑)：

dist 1 [u] = Edge[v][u]

dist k [u] = min{ dist k-1 [u], min{ dist k-1 [j] + Edge[j][u] } }, j=0,1,…,n-1,j≠u

Dijkstra算法和Bellman算法思想有很大的區別：Dijkstra算法在求解過程中，源點到集合S內各頂點的最短路徑一旦求出，則之后不變了，修改的僅僅是源點到T集合中各頂點的最短路徑長度。Bellman算法在求解過程中，每次循環都要修改所有頂點的dist[ ]，也就是說源點到各頂點最短路徑長度一直要到Bellman算法結束才確定下來。

算法適用條件

1.單源最短路徑(從源點s到其它所有頂點v)
有向圖&無向圖(無向圖可以看作(u,v),(v,u)同屬於邊集E的有向圖)
邊權可正可負(如有負權回路輸出錯誤提示)
差分約束系統(至今貌似只看過一道題)

Bellman-Ford算法描述：

初始化：將除源點外的所有頂點的最短距離估計值 d[v] ←+∞, d[s] ←0
迭代求解：反復對邊集E中的每條邊進行松弛操作，使得頂點集V中的每個頂點v的最短距離估計值逐步逼近其最短距離；（運行|v|-1次，看下面的描述性證明(當做樹)）
檢驗負權回路：判斷邊集E中的每一條邊的兩個端點是否收斂。如果存在未收斂的頂點，則算法返回false，表明問題無解；否則算法返回true，並且從源點可達的頂點v的最短距離保存在d[v]中

描述性證明：(這個解釋很好)

首先指出，圖的任意一條最短路徑既不能包含負權回路，也不會包含正權回路，因此它最多包含|v|-1條邊。

其次，從源點s可達的所有頂點如果存在最短路徑，則這些最短路徑構成一個以s為根的最短路徑樹。Bellman-Ford算法的迭代松弛操作，實際上就是按頂點距離s的層次，逐層生成這棵最短路徑樹的過程。

在對每條邊進行1遍松弛的時候，生成了從s出發，層次至多為1的那些樹枝。也就是說，找到了與s至多有1條邊相聯的那些頂點的最短路徑；對每條邊進行第2遍松弛的時候，生成了第2層次的樹枝，就是說找到了經過2條邊相連的那些頂點的最短路徑……。因為最短路徑最多只包含|v|-1條邊，所以，只需要循環|v|-1 次。

每實施一次松弛操作，最短路徑樹上就會有一層頂點達到其最短距離，此后這層頂點的最短距離值就會一直保持不變，不再受后續松弛操作的影響。（但是，每次還要判斷松弛，這里浪費了大量的時間，這就是Bellman-Ford算法效率底下的原因，也正是SPFA優化的所在）。

，如圖(沒找到畫圖工具的射線)，若是B和C的最短路徑不更新，那么點D的最短路徑肯定也無法更新，這就是優化所在。

如果沒有負權回路，由於最短路徑樹的高度最多只能是|v|-1，所以最多經過|v|-1遍松弛操作后，所有從s可達的頂點必將求出最短距離。如果 d[v]仍保持 +∞，則表明從s到v不可達。

如果有負權回路，那么第 |v|-1 遍松弛操作仍然會成功，這時，負權回路上的頂點不會收斂。

參考了《圖論》。

問題：Bellman-Ford算法是否一定要循環n-1次么？未必！其實只要在某次循環過程中，考慮每條邊后，都沒能改變當前源點到所有頂點的最短路徑長度，那么Bellman-Ford算法就可以提前結束了(開篇提出的小優化就是這個)。

上代碼(參考了牛帥的博客)

 1 #include<iostream>
 2 #include<cstdio>
 3 using namespace std;
 4 #define MAX 0x3f3f3f3f
 5 #define N 1010
 6 int nodenum, edgenum, original; //點，邊，起點
 7 typedef struct Edge //邊
 8 {
 9   int u, v;
10   int cost;
11 }Edge;
12 Edge edge[N];
13 int dis[N], pre[N];
14 bool Bellman_Ford()
15 {
16   for(int i = 1; i <= nodenum; ++i) //初始化
17     dis[i] = (i == original ? 0 : MAX);
18   for(int i = 1; i <= nodenum - 1; ++i)
19     for(int j = 1; j <= edgenum; ++j)
20       if(dis[edge[j].v] > dis[edge[j].u] + edge[j].cost) //松弛（順序一定不能反~）
21       {
22         dis[edge[j].v] = dis[edge[j].u] + edge[j].cost;
23         pre[edge[j].v] = edge[j].u;
24       }
25       bool flag = 1; //判斷是否含有負權回路
26       for(int i = 1; i <= edgenum; ++i)
27         if(dis[edge[i].v] > dis[edge[i].u] + edge[i].cost)
28         {
29           flag = 0;
30           break;
31         }
32         return flag;
33 }
34 void print_path(int root) //打印最短路的路徑（反向）
35 {
36   while(root != pre[root]) //前驅
37   {
38     printf("%d-->", root);
39     root = pre[root];
40   }
41   if(root == pre[root])
42     printf("%d\n", root);
43 }
44 int main()
45 {
46   scanf("%d%d%d", &nodenum, &edgenum, &original);
47   pre[original] = original;
48   for(int i = 1; i <= edgenum; ++i)
49   {
50     scanf("%d%d%d", &edge[i].u, &edge[i].v, &edge[i].cost);
51   }
52   if(Bellman_Ford())
53     for(int i = 1; i <= nodenum; ++i) //每個點最短路
54     {
55       printf("%d\n", dis[i]);
56       printf("Path:");
57       print_path(i);
58     }
59   else
60     printf("have negative circle\n");
61   return 0;
62 }

四.SPFA算法

用一個隊列來進行維護。初始時將源加入隊列。每次從隊列中取出一個元素，並對所有與他相鄰的點進行松弛，若某個相鄰的點松弛成功，則將其入隊。直到隊列為空時算法結束；這個算法，簡單的說就是隊列優化的bellman-ford，利用了每個點不會更新次數太多的特點發明的此算法(看我上面那個圖，只有相鄰點更新了，該點才有可能更新) 。

代碼參見： http://www.cnblogs.com/hxsyl/p/3248391.html

徹底弄懂最短路徑問題

徹底弄懂最短路徑問題

免責聲明！