今天終於用模擬退火過了一道題:CodeVS: P1344。
有 N ( <=20 ) 台 PC 放在機房內,現在要求由你選定一台 PC,用共 N-1 條網線從這台機器開始一台接一台地依次連接他們,最后接到哪個以及連接的順序也是由你選定的,為了節省材料,網線都拉直。求最少需要一次性購買多長的網線。(說白了,就是找出 N 的一個排列 P1 P2 P3 ..PN 然后 P1 -> P2 -> P3 -> ... -> PN 找出 |P1P2|+|P2P3|+...+|PN-1PN| 長度的最小值)
這種問題被稱為最優組合問題。傳統的動態規划算法O(n22n)在n = 20的情況下空間、時間、精度都不能滿足了。這時應該使用比較另類的算法。隨機化算法在n比較小的最優化問題表現較好,我們嘗試使用隨機化算法。
1 #include<cstdio> 2 #include<cstdlib> 3 #include<ctime> 4 #include<cmath> 5 #include<algorithm> 6 7 const int maxn = 21; 8 double x[maxn], y[maxn]; 9 double dist[maxn][maxn]; 10 int path[maxn]; 11 int n; 12 double path_dist(){ 13 double ans = 0; 14 for(int i = 1; i < n; i++) { 15 ans += dist[path[i - 1]][path[i]]; 16 } 17 return ans; 18 } 19 int main(){ 20 srand(19260817U); // 使用確定的種子初始化隨機函數是不錯的選擇 21 scanf("%d", &n); 22 for(int i = 0; i < n; i++) scanf("%lf%lf", x + i, y + i); 23 for(int i = 0; i < n; i++) for(int j = i + 1; j < n; j++) dist[i][j] = dist[j][i] = hypot(x[i] - x[j], y[i] - y[j]); 24 25 for(int i = 0; i < n; i++) path[i] = i; // 獲取初始排列 26 double ans = path_dist(); // 初始答案 27 int T = 30000000 / n; // 單次計算的復雜度是O(n),這里的30000000是試出來的 28 while(T--){ 29 std::random_shuffle(path, path + n); // 隨機打亂排列 30 ans = std::min(ans, path_dist()); // 更新最小值 31 } 32 printf("%.2lf", ans); 33 }
可惜的是,這個算法只能拿50分。使用O(n!)枚舉排列和使用上述算法沒有太大的不同。從解的角度分析,假如某一次計算嘗試出了一個比較好的路徑,那么最優的路徑很可能可以在原基礎上作一兩次改動就可以得到,這時候完全打亂整個序列不是一個很好的選擇。
另一個方法:根據原序列生成一個新的序列,然后交換新序列的任意兩個數。假如說新生成的序列更優,則使用新序列繼續計算,否則序列不變。
這個算法就是局部搜索法(爬山法)。可惜,這個算法不正確。這個算法只顧眼前,忽略了大局,只要更優便走,這樣可能會造成“盯着眼前的小山包,忽略遠處的最高峰”,找到的值往往只是“局部最優值”。當然——這個方法也並不是完全不正確。我們可以多次計算使用上述方法計算,取最值。這里不再贅述。
下面介紹退火算法(SA,Simulated Annealing)。
首先拿爬山做例子:我們要找到山脈的最高峰,但是我(計算機)只能看到我的腳下哪邊是上升的,哪邊是下降的,看不到遠處是否上升。每次移動,我們隨機選擇一個方向。如果這個方向是上升的的(更優),那么就決定往那個方向走;如果這個方向是下降的(更差),那么“隨機地接受”這個方向,接受就走,不接受就再隨機一次——這個隨機是關鍵,要考慮很多因素。比如,一個陡的下坡的接受率要比一個緩的下坡要小(因為陡的下坡后是答案的概率小);同樣的下降坡度,接受的概率隨時間降低(逐漸降低才能趨向穩定)。
為什么要接受一個更差的解呢?如下圖所示:
如果堅決不接受一個更差的解,那么就會卡在上面的“當前位置”上了。倘若接受多幾次更差的解,讓他移動到山谷那里,則可以突破局部最優解,得到全局最優解。
既然這個隨機這么重要,那么我們就將它寫為一個函數:
bool accept(double delta, double temper){ if(delta <= 0) return true; return rand() <= exp((-delta) / temper) * RAND_MAX; }
其中delta是新答案的變化量,temper是當前的“溫度”。溫度是模擬退火算法的一個重要概念,它隨時間的推移緩慢減小。我們來分析一下這個代碼:
if(delta <= 0) return true;
由於答案越小越優,因此當溫度的變化量小於零(新答案減小)時,新解比舊解優,因此返回“接受”
return rand() <= exp((-delta) / temper) * RAND_MAX;
RAND_MAX是rand()的最大值。為了保證跨平台、跨編譯器甚至跨版本時的正常運作,我們不對其作出任何假定。
我們把它移項:return (double)rand() / RAND_MAX <= exp((-delta) / temper)。在右邊,temper是正數,delta是正數(delta是負數的已經return出去了),因此exp()中間的參數是負數。我們知道,指數函數在參數是負數時返回(0, 1)——這就是接受的概率。我們在左邊隨機一個實數,如果它比概率小,就接受,否則就不接受。
然后將RAND_MAX移到右邊,以省下昂貴的除法成本和避免浮點數的各種陷阱。
有了接受函數,就可以寫計算過程了:
double solve(){ const double max_temper = 10000; double temp = max_temper; double dec = 0.999; Path p; while(temp > 0.1){ Path p2(p); if(accept(p2.dist() - p.dist(), temp)) p = p2; temp *= dec; } return p.dist(); }
其中Path是路徑,它有一個構造函數是接受另一個Path類型的對象,然后交換其中兩個點的順序。
1 struct Path{ 2 City path[maxn]; 3 4 Path(){ 5 F(i, n) path[i] = citys[i]; 6 } 7 8 Path(const Path& p):path(p.path){ 9 swap(path[rand() % n], path[rand() % n]); 10 } 11 12 void shuffle(){ 13 random_shuffle(path, path + n); 14 } 15 16 double dist(){ 17 double ans = 0; 18 for(int i = 1; i < n; i++){ 19 ans += path[i - 1].distTo(path[i]); 20 } 21 return ans; 22 } 23 };
上文的City是路徑一個點。而void shuffle()是隨機打亂整個序列(在本題沒有用上)。
下面是City的定義:
1 struct City{ 2 double x, y; 3 City(){} 4 City(double x, double y):x(x), y(y){} 5 double distTo(const City& rhs) const { 6 return hypot(x - rhs.x, y - rhs.y); 7 } 8 friend istream& operator >> (istream& in, City& c){ 9 return in >> c.x >> c.y; 10 } 11 }citys[maxn];
最后是程序的主框架:
1 int main(){ 2 srand(19260817U); 3 ios::sync_with_stdio(false); 4 cin >> n; 5 F(i, n) cin >> citys[i]; 6 double ans = 1./0; 7 int T = 15; 8 while(T--){ 9 ans = min(ans, solve()); 10 } 11 printf("%.2lf", ans); 12 }
完整代碼如下:
1 #define F(i, n) for(int i = 0; i < n; i++) 2 #define F1(i,n) for(int i = 1; i <=n; i++) 3 #include<cmath> 4 #include<algorithm> 5 #include<iostream> 6 #include<cstdio> 7 using namespace std; 8 9 const int maxn = 21; 10 int n; 11 struct City{ 12 double x, y; 13 City(){} 14 City(double x, double y):x(x), y(y){} 15 double distTo(const City& rhs) const { 16 return hypot(x - rhs.x, y - rhs.y); 17 } 18 friend istream& operator >> (istream& in, City& c){ 19 return in >> c.x >> c.y; 20 } 21 }citys[maxn]; 22 23 struct Path{ 24 City path[maxn]; 25 26 Path(){ 27 F(i, n) path[i] = citys[i]; 28 } 29 30 Path(const Path& p):path(p.path){ 31 swap(path[rand() % n], path[rand() % n]); 32 } 33 34 void shuffle(){ 35 random_shuffle(path, path + n); 36 } 37 38 double dist(){ 39 double ans = 0; 40 for(int i = 1; i < n; i++){ 41 ans += path[i - 1].distTo(path[i]); 42 } 43 return ans; 44 } 45 }; 46 47 48 49 bool accept(double delta, double temper){ 50 if(delta <= 0) return true; 51 return rand() <= exp((-delta) / temper) * RAND_MAX; 52 } 53 54 double solve(){ 55 const double max_temper = 10000; 56 double temp = max_temper; 57 double dec = 0.999; 58 Path p; 59 while(temp > 0.1){ 60 Path p2(p); 61 if(accept(p2.dist() - p.dist(), temp)) p = p2; 62 temp *= dec; 63 } 64 return p.dist(); 65 } 66 67 int main(){ 68 srand(19260817U); 69 ios::sync_with_stdio(false); 70 cin >> n; 71 F(i, n) cin >> citys[i]; 72 double ans = 1./0; 73 int T = 155; 74 while(T--){ 75 ans = min(ans, solve()); 76 } 77 printf("%.2lf", ans); 78 }
其實本代碼在很多地方寫復雜了,比如累贅的City類。在比賽中,我們不會寫得如此復雜。下面對其簡化:
1 #include<cstring> 2 #include<cmath> 3 #include<algorithm> 4 #include<iostream> 5 #include<cstdio> 6 using namespace std; 7 8 const int maxn = 21; 9 int n; 10 double x[maxn], y[maxn]; 11 double dist[maxn][maxn]; 12 13 struct Path{ 14 int path[maxn]; 15 16 Path(){ 17 for(int i = 0; i < n; i++) path[i] = i; 18 } 19 20 Path(const Path& p){ 21 memcpy(path, p.path, sizeof path); 22 swap(path[rand() % n], path[rand() % n]); 23 } 24 25 double dist(){ 26 double ans = 0; 27 for(int i = 1; i < n; i++){ 28 ans += ::dist[path[i - 1]][path[i]]; 29 } 30 return ans; 31 } 32 }; 33 34 35 36 bool accept(double delta, double temper){ 37 if(delta <= 0) return true; 38 return rand() <= exp((-delta) / temper) * RAND_MAX; 39 } 40 41 double solve(){ 42 const double max_temper = 10000; 43 const double dec = 0.999; 44 double temp = max_temper; 45 Path p; 46 while(temp > 0.01){ 47 Path p2(p); 48 if(accept(p2.dist() - p.dist(), temp)) p = p2; 49 temp *= dec; 50 } 51 return p.dist(); 52 } 53 54 int main(){ 55 srand(19260817U); 56 cin >> n; 57 for(int i = 0; i < n; i++) { 58 scanf("%lf%lf", x + i, y + i); 59 } 60 for(int i = 0; i < n; i++){ 61 dist[i][i] = 0; 62 for(int j = i + 1; j < n; j++){ 63 dist[i][j] = dist[j][i] = hypot(x[i] - x[j], y[i] - y[j]); 64 } 65 } 66 double ans = 1./0; 67 int T = 155; 68 while(T--){ 69 ans = min(ans, solve()); 70 } 71 printf("%.2lf", ans); 72 }
交上去就可以AC了。
由於隨機化算法有一定不穩定性,這里要多次調用計算過程取最小值。T=155就是外循環次數。
值得注意的是,T=15就可以過80%的數據,T=42可以過完全部數據,此時最大數據運行時間為86ms。這里T取155是保險起見,畢竟時間足夠。
上面的代碼仍有改進的余地。比如,在solve()函數中,應當把最優解記下來,在返回解時返回記下的那個最優解,免得跳到了某些差解后返回差解。
下面是一張表供大家估算運行時間,左邊是“降溫系數”,上方是初溫與末溫的比值,表格內容是大致的迭代次數。
從上表可以看出,增加十倍的初溫與末溫比值只會增加約25%的迭代次數,而往0.9…99的后面加個9會增加十倍的運行時間。
除了記憶上表外,我們還可以通過記錄退火次數(將tot初始化為零,每次產生新解時tot++,計算完后看看tot)或者使用計算器計算退火次數。計算后選擇一個合適的外循環次數。
除此之外,我們還要根據數據規模,靈活地調整初溫、末溫與降溫系數。一般來說,初溫不宜太大,否則會讓前幾次迭代接受了很差的解,浪費時間;降溫系數不宜過大,否則會讓算法過早穩定,不能找到最優值;同樣,降溫系數也不宜太高(更不能大於1,不然溫度越來越高),否則可能會超時。
在正式使用中還有些技巧,如每次降溫后,做足夠多次計算后才再次降溫(內循環),這對算法准確性沒有太大影響。
除了模擬退火外,還有不少隨機化算法。比如遺傳算法、蟻群算法,這些算法被稱為“元啟發算法”,有興趣的讀者可以查閱相關資料。