一、基本概念
在計算機科學中,分治法是一種很重要的算法。字面上的解釋是“分而治之”,就是把一個復雜的問題分成兩個或更多的相同或相似的子問題,再把子問題分成更小的子問題……直到最后子問題可以簡單的直接求解,原問題的解即子問題的解的合並。這個技巧是很多高效算法的基礎,如排序算法(快速排序,歸並排序),傅立葉變換(快速傅立葉變換)……
任何一個可以用計算機求解的問題所需的計算時間都與其規模有關。問題的規模越小,越容易直接求解,解題所需的計算時間也越少。例如,對於n個元素的排序問題,當n=1時,不需任何計算。n=2時,只要作一次比較即可排好序。n=3時只要作3次比較即可,…。而當n較大時,問題就不那么容易處理了。要想直接解決一個規模較大的問題,有時是相當困難的。
二、基本思想及策略
分治法的設計思想是:將一個難以直接解決的大問題,分割成一些規模較小的相同問題,以便各個擊破,分而治之。
分治策略是:對於一個規模為n的問題,若該問題可以容易地解決(比如說規模n較小)則直接解決,否則將其分解為k個規模較小的子問題,這些子問題互相獨立且與原問題形式相同,遞歸地解這些子問題,然后將各子問題的解合並得到原問題的解。這種算法設計策略叫做分治法。
如果原問題可分割成k個子問題,1<k≤n,且這些子問題都可解並可利用這些子問題的解求出原問題的解,那么這種分治法就是可行的。由分治法產生的子問題往往是原問題的較小模式,這就為使用遞歸技術提供了方便。在這種情況下,反復應用分治手段,可以使子問題與原問題類型一致而其規模卻不斷縮小,最終使子問題縮小到很容易直接求出其解。這自然導致遞歸過程的產生。分治與遞歸像一對孿生兄弟,經常同時應用在算法設計之中,並由此產生許多高效算法。
三、分治法適用的情況
分治法所能解決的問題一般具有以下幾個特征:
1) 該問題的規模縮小到一定的程度就可以容易地解決
2) 該問題可以分解為若干個規模較小的相同問題,即該問題具有最優子結構性質。
3) 利用該問題分解出的子問題的解可以合並為該問題的解;
4) 該問題所分解出的各個子問題是相互獨立的,即子問題之間不包含公共的子子問題。
第一條特征是絕大多數問題都可以滿足的,因為問題的計算復雜性一般是隨着問題規模的增加而增加;
第二條特征是應用分治法的前提它也是大多數問題可以滿足的,此特征反映了遞歸思想的應用;、
第三條特征是關鍵,能否利用分治法完全取決於問題是否具有第三條特征,如果具備了第一條和第二條特征,而不具備第三條特征,則可以考慮用貪心法或動態規划法。
第四條特征涉及到分治法的效率,如果各子問題是不獨立的則分治法要做許多不必要的工作,重復地解公共的子問題,此時雖然可用分治法,但一般用動態規划法較好。
四、可使用分治法求解的一些經典問題
五、分治法的基本步驟
分治法在每一層遞歸上都有三個步驟:
step1 分解:將原問題分解為若干個規模較小,相互獨立,與原問題形式相同的子問題;
step2 解決:若子問題規模較小而容易被解決則直接解,否則遞歸地解各個子問題
step3 合並:將各個子問題的解合並為原問題的解。
它的一般的算法設計模式如下:
Divide-and-Conquer(P)
1. if |P|≤n0
2. then return(ADHOC(P))
3. 將P分解為較小的子問題 P1 ,P2 ,…,Pk
4. for i←1 to k
5. do yi ← Divide-and-Conquer(Pi) △ 遞歸解決Pi
6. T ← MERGE(y1,y2,…,yk) △ 合並子問題
7. return(T)
其中|P|表示問題P的規模;n0為一閾值,表示當問題P的規模不超過n0時,問題已容易直接解出,不必再繼續分解。ADHOC(P)是該分治法中的基本子算法,用於直接解小規模的問題P。因此,當P的規模不超過n0時直接用算法ADHOC(P)求解。算法MERGE(y1,y2,…,yk)是該分治法中的合並子算法,用於將P的子問題P1 ,P2 ,…,Pk的相應的解y1,y2,…,yk合並為P的解。
六、分治法的復雜性分析
一個分治法將規模為n的問題分成k個規模為n/m的子問題去解。設分解閥值n0=1,且adhoc解規模為1的問題耗費1個單位時間。再設將原問題分解為k個子問題以及用merge將k個子問題的解合並為原問題的解需用f(n)個單位時間。用T(n)表示該分治法解規模為|P|=n的問題所需的計算時間,則有:
T(n)= k T(n/m)+f(n)
通過迭代法求得方程的解
七、依據分治法設計程序時的思維過程
八、算法舉例
(1)二分查找
二分查找也是典型的分治算法的有應用。二分查找需要一個默認的前提,那就是查找的數列是有序的。
二分查找的思路比較簡單:
1) 選擇一個標志i將集合分為二個子集合
2) 判斷標志L(i)是否能與要查找的值des相等,相等則直接返回
3) 否則判斷L(i)與des的大小
4) 基於判斷的結果決定下步是向左查找還是向右查找
5) 遞歸記性上面的步驟

(2)輸油管道問題
解題思路
本題目可以分為兩個步驟:
1、找出主管道的位置;
2、根據主管道的位置,計算各個油井到主管道的長度之和。
根據題意,設主管道貫穿東西,與y 軸平行。而各個子油井則分布在主輸油管道的上下兩側。如下圖:

由上圖,其實只需要確定主管道的y 坐標,而與各個子油井的x 坐標無關!
根據猜測,易知:主管道的y 坐標就是所有子油井y 坐標的中位數。(可以用平面幾何知識證明,略)
求中位數的方法可以用排序后取a[(left+right)/2],當然更推薦用書上的線性時間選擇算法解決。記求得的主管道為Ym,
最后要輸出的結果只需要計算,每個油井與中位數的差值之和。
#include <stdio.h> #include <stdlib.h>
void swap(int &a,int &b) { int tmp = a; a = b; b = tmp; } //(此處的划分就體現了分治的思想)本函數求arr[p:q]的一個划分i,使arr[p:i-1]都小於arr[i],arr[i+1,q]都大於arr[i]
int partition(int *arr,int p,int q) { int index = p-1, start = p, base = arr[q]; for(;start<q;start++) { if(arr[start]<=base) { swap(arr[start],arr[++index]); } } swap(arr[++index],arr[q]);
return index; } //快速排序
void qsort (int *arr,int p ,int q) { if (p<=q) { int pos = partition(arr,p,q); qsort(arr,p,pos-1); qsort(arr,pos+1,q); } } int arr[1000]; int main() { int n; while(scanf("%d",&n)!=EOF){ for(int i=0;i<n;i++){ scanf("%d %d",&arr[i],&arr[i]); } qsort(arr,0,n-1); long long sum = 0; int mid = arr[n/2]; for(int i=0;i<n;i++){ sum+=abs(mid - arr[i]); } printf("%I64d\n",sum); } return 0; }
說明:類似的還有郵局選址問題:與之類似,這次是要找出在居民點中郵局的最佳位置。很容易想到,這次不僅要確定y的坐標,還要確定x的坐標。當然均為其對應坐標的中位數;最終的計算結果,要求距離之和,即向量模的計算方法加和即可。
(3)集合的划分
F(n,m)表示把n個元素的集合分為m個子集,有多少種分法?
n個元素的集合可以划為F(n,m)個不同的由m個非空子集組成的集合。
考慮3個元素的集合,可划分為:
① 1個子集的集合:{ {1,2,3} }
② 2個子集的集合:{{1,2} ,{3}} , {{1,3},{2}} , {{2,3},{1}}
③ 3個子集的集合:{{1},{2},{3}}
所以 F(3,1)=1
F(3,2)=3
F(3,3)=1
如果要求F(4,2)該怎么辦呢?
A.往①里添加一個元素 {4} ,得到{{1,2,3},{4}}
B.往②里的任意一個子集添一個4,得到
{{1,2,4},{3}} , {{1,2},{3,4}}
{{1,3,4},{2}} , {{1,3},{2,4}}
{{2,3,4},{1}} , {{2,3},{1,4}}
所以F(4,2) = F(3,1)+2*F(3,2) = 7
以此推廣得,F(n,m) = F (n-1,m-1)+ m * F(n-1,m)
#include <stdio.h> long long divide( int n,int m) { if (m==1 || m ==n){ return 1; }else{ return divide(n-1,m-1)+m*divide(n-1,m); } } int main(){ int n,m; while (scanf("%d%d",&n,&m) != EOF){ printf("%I64d\n",divide(n,m)); } return 0; }
(4)求復雜度為O(lg n)的X的 n 次冪
#include "stdio.h" #include "stdlib.h" int power(int x, int n) { int result; if(n == 1) return x; if( n % 2 == 0) result = power(x, n/2) * power(x, n / 2); else result = power(x, (n+1) / 2) * power(x, (n-1) / 2); return result; } int main() { int x = 5; int n = 3; printf("power(%d,%d) = %d \n",x, n, power(x, n)); }
(5)二路歸並排序
描述:
時間復雜度是O(NlogN),空間復制度為O(N)(歸並排序的最大缺陷)
歸並排序(Merge Sort)完全遵循上述分治法三個步驟:
1、分解:將要排序的n個元素的序列分解成兩個具有n/2個元素的子序列;
2、解決:使用歸並排序分別遞歸地排序兩個子序列;
3、合並:合並兩個已排序的子序列,產生原問題的解。
數組代碼實現:
#include "stdio.h" #include "stdlib.h" #include "assert.h" #include "string.h" void print_arr(int *arr, int len) { int i = 0; for(i = 0; i < len; i ++) printf("%d ",arr[i]); printf("\n"); } void merge(int *arr, int low, int mid, int hight, int *tmp) { assert(arr && low >= 0 && low <= mid && mid <= hight); int i = low; int j = mid + 1; int index = 0; while(i <= mid && j <= hight) { if(arr[i] <= arr[j]) tmp[index++] = arr[i++]; else tmp[index++] = arr[j++]; } while(i <= mid) //拷貝剩下的左半部分 tmp[index++] = arr[i++]; while(j <= hight) //拷貝剩下的右半部分 tmp[index++] = arr[j++]; memcpy((void *)(arr + low), (void *)tmp, (hight - low + 1) * sizeof(int)); } void mergesort(int *arr, int low, int hight, int *tmp) { assert(arr && low >= 0); int mid; if(low < hight) { mid = (hight + low) >> 1; mergesort(arr, low, mid,tmp); mergesort(arr, mid + 1, hight,tmp); merge(arr, low, mid, hight,tmp); } } //只分配一次內存,避免內存操作開銷 void mergesort_drive(int *arr, int len) { int *tmp = (int *)malloc(len * sizeof(int)); if(!tmp) { printf("out of memory\n"); exit(0); } mergesort(arr, 0, len - 1, tmp); free(tmp); } int main() { int data[10]={8,7,2,6,9,10,3,4,5,1}; int len = sizeof(data)/sizeof(data[0]); mergesort_drive(data, len); print_arr(data,len); return 0; }
(6)整數划分問題
/* 整數划分問題 :將一個整數划分為若干個數相加 例子: 整數4 最大加數 4 4=4 1+3=4 1+1+2=4 2+2=4 1+1+1+1=4 一共五種划分方案 注意:1+3=4,3+1=4被認為是同一種划分方案 */ #include<stdio.h> int q(int n,int m)//n表示需要划分的數字,m表示最大的加數不超過m { if(m==1||n==1)//只要存在一個為1,那么划分的方法數肯定只有一種,那就是n個1相加 { return 1; }else if(n==m&&n>1)//二者相等且大於1的時候,問題等價於:q(n,n-1)+1;意味着將最大加數減一之后n的划分數,然后加一,最后面那個一代表的是:0+n,這個划分的方案 { return q(n,n-1)+1; }else if(n<m)//如果m>n,那么令m=n就ok,因為最大加數在邏輯上不可能超過n { return q(n,n); }else if(n>m) { return q(n,m-1)+q(n-m,m);//分為兩種:划分方案沒有m的情況+划分方案有m的情況 } return 0; } int main() { printf("請輸入需要划分的數字和最大家數:\n"); int n,m; scanf("%d %d",&n,&m); int r=q(n,m); printf("%d\n",r); return 0; }
給你一個數,問你所有的划分方式,比如4,4=1+3,4=1+1+2,4=2+2,4=1+1+1+1
我們來分析一下,我們想用分治的話,就要找子問題,假設n是要划分的數,m說最大的加數,n=4,m=3
分解成兩類的子問題,一個是:一個是有m的情況,一個是沒有m的情況,然后將有m的情況繼續划分,分
解成有m-1和沒有m-1的情況,一直划分下去,直到m=1。比如n=4,m=3,划分成的子問題:有3,無
3,有2,無2,有1,無1(沒有意義,除非0+4=4),將這些子問題合並起來大問題就解決了。
九、總結
分治算法的一個核心在於子問題的規模大小是否接近,如果接近則算法效率較高。
分治算法和動態規划都是解決子問題,然后對解進行合並;但是分治算法是尋找遠小於原問題的子問題(因為對於計算機來說計算小數據的問題還是很快的),同時分治算法的效率並不一定好,而動態規划的效率取決於子問題的個數的多少,子問題的個數遠小於子問題的總數的情況下(也就是重復子問題多),算法才會很高效。
