分治算法詳解及經典例題


一、基本概念

    在計算機科學中,分治法是一種很重要的算法。字面上的解釋是“分而治之”,就是把一個復雜的問題分成兩個或更多的相同或相似的子問題,再把子問題分成更小的子問題……直到最后子問題可以簡單的直接求解,原問題的解即子問題的解的合並。這個技巧是很多高效算法的基礎,如排序算法(快速排序,歸並排序),傅立葉變換(快速傅立葉變換)……

    任何一個可以用計算機求解的問題所需的計算時間都與其規模有關。問題的規模越小,越容易直接求解,解題所需的計算時間也越少。例如,對於n個元素的排序問題,當n=1時,不需任何計算。n=2時,只要作一次比較即可排好序。n=3時只要作3次比較即可,…。而當n較大時,問題就不那么容易處理了。要想直接解決一個規模較大的問題,有時是相當困難的。

二、基本思想及策略

    分治法的設計思想是:將一個難以直接解決的大問題,分割成一些規模較小的相同問題,以便各個擊破,分而治之。

    分治策略是:對於一個規模為n的問題,若該問題可以容易地解決(比如說規模n較小)則直接解決,否則將其分解為k個規模較小的子問題,這些子問題互相獨立且與原問題形式相同,遞歸地解這些子問題,然后將各子問題的解合並得到原問題的解。這種算法設計策略叫做分治法。

    如果原問題可分割成k個子問題,1<k≤n,且這些子問題都可解並可利用這些子問題的解求出原問題的解,那么這種分治法就是可行的。由分治法產生的子問題往往是原問題的較小模式,這就為使用遞歸技術提供了方便。在這種情況下,反復應用分治手段,可以使子問題與原問題類型一致而其規模卻不斷縮小,最終使子問題縮小到很容易直接求出其解。這自然導致遞歸過程的產生。分治與遞歸像一對孿生兄弟,經常同時應用在算法設計之中,並由此產生許多高效算法。

三、分治法適用的情況

分治法所能解決的問題一般具有以下幾個特征:

1) 該問題的規模縮小到一定的程度就可以容易地解決

2) 該問題可以分解為若干個規模較小的相同問題,即該問題具有最優子結構性質。

3) 利用該問題分解出的子問題的解可以合並為該問題的解;

4) 該問題所分解出的各個子問題是相互獨立的,即子問題之間不包含公共的子子問題。

第一條特征是絕大多數問題都可以滿足的,因為問題的計算復雜性一般是隨着問題規模的增加而增加;

第二條特征是應用分治法的前提它也是大多數問題可以滿足的,此特征反映了遞歸思想的應用;、

第三條特征是關鍵,能否利用分治法完全取決於問題是否具有第三條特征,如果具備了第一條和第二條特征,而不具備第三條特征,則可以考慮用貪心法或動態規划法。

第四條特征涉及到分治法的效率,如果各子問題是不獨立的則分治法要做許多不必要的工作,重復地解公共的子問題,此時雖然可用分治法,但一般用動態規划法較好。

四、可使用分治法求解的一些經典問題

(1)二分搜索
(2)大整數乘法
(3)Strassen矩陣乘法
(4)棋盤覆蓋
(5)合並排序
(6)快速排序
(7)線性時間選擇
(8)最接近點對問題
(9)循環賽日程表
(10)漢諾塔
 

五、分治法的基本步驟

分治法在每一層遞歸上都有三個步驟:

step1 分解:將原問題分解為若干個規模較小,相互獨立,與原問題形式相同的子問題;

step2 解決:若子問題規模較小而容易被解決則直接解,否則遞歸地解各個子問題

step3 合並:將各個子問題的解合並為原問題的解。

它的一般的算法設計模式如下:

Divide-and-Conquer(P)

1. if |P|≤n0

2. then return(ADHOC(P))

3. 將P分解為較小的子問題 P1 ,P2 ,…,Pk

4. for i←1 to k

5. do yi ← Divide-and-Conquer(Pi) △ 遞歸解決Pi

6. T ← MERGE(y1,y2,…,yk) △ 合並子問題

7. return(T)

    其中|P|表示問題P的規模;n0為一閾值,表示當問題P的規模不超過n0時,問題已容易直接解出,不必再繼續分解。ADHOC(P)是該分治法中的基本子算法,用於直接解小規模的問題P。因此,當P的規模不超過n0時直接用算法ADHOC(P)求解。算法MERGE(y1,y2,…,yk)是該分治法中的合並子算法,用於將P的子問題P1 ,P2 ,…,Pk的相應的解y1,y2,…,yk合並為P的解。

六、分治法的復雜性分析

   一個分治法將規模為n的問題分成k個規模為n/m的子問題去解。設分解閥值n0=1,且adhoc解規模為1的問題耗費1個單位時間。再設將原問題分解為k個子問題以及用merge將k個子問題的解合並為原問題的解需用f(n)個單位時間。用T(n)表示該分治法解規模為|P|=n的問題所需的計算時間,則有:

T(n)= k T(n/m)+f(n)

通過迭代法求得方程的解

七、依據分治法設計程序時的思維過程

實際上就是類似於數學歸納法,找到解決本問題的求解方程公式,然后根據方程公式設計遞歸程序。
1、一定是先找到最小問題規模時的求解方法
2、然后考慮隨着問題規模增大時的求解方法
3、找到求解的遞歸函數式后(各種規模或因子),設計遞歸程序即可。

八、算法舉例

(1)二分查找

二分查找也是典型的分治算法的有應用。二分查找需要一個默認的前提,那就是查找的數列是有序的。 
二分查找的思路比較簡單: 
1) 選擇一個標志i將集合分為二個子集合 
2) 判斷標志L(i)是否能與要查找的值des相等,相等則直接返回 
3) 否則判斷L(i)與des的大小 
4) 基於判斷的結果決定下步是向左查找還是向右查找 
5) 遞歸記性上面的步驟

 

(2)輸油管道問題

解題思路 
本題目可以分為兩個步驟: 

  1、找出主管道的位置; 
  2、根據主管道的位置,計算各個油井到主管道的長度之和。

根據題意,設主管道貫穿東西,與y 軸平行。而各個子油井則分布在主輸油管道的上下兩側。如下圖:

由上圖,其實只需要確定主管道的y 坐標,而與各個子油井的x 坐標無關!

根據猜測,易知:主管道的y 坐標就是所有子油井y 坐標的中位數。(可以用平面幾何知識證明,略)

求中位數的方法可以用排序后取a[(left+right)/2],當然更推薦用書上的線性時間選擇算法解決。記求得的主管道為Ym,

最后要輸出的結果只需要計算,每個油井與中位數的差值之和。

#include <stdio.h>  #include <stdlib.h> 

void swap(int &a,int &b) {   int tmp = a;  a = b;   b = tmp;  } //(此處的划分就體現了分治的思想)本函數求arr[p:q]的一個划分i,使arr[p:i-1]都小於arr[i],arr[i+1,q]都大於arr[i]

int partition(int *arr,int p,int q) {     int index = p-1,     start = p,     base = arr[q];   for(;start<q;start++)  {        if(arr[start]<=base) {         swap(arr[start],arr[++index]);       }     }     swap(arr[++index],arr[q]);
    return index; } //快速排序

void qsort (int *arr,int p ,int q) {   if (p<=q) {     int pos = partition(arr,p,q);     qsort(arr,p,pos-1);     qsort(arr,pos+1,q);    } } int arr[1000]; int main() {   int n;   while(scanf("%d",&n)!=EOF){     for(int i=0;i<n;i++){       scanf("%d %d",&arr[i],&arr[i]);     }     qsort(arr,0,n-1);     long long sum = 0;     int mid = arr[n/2];     for(int i=0;i<n;i++){       sum+=abs(mid - arr[i]);     }     printf("%I64d\n",sum);   } return 0; }

 說明:類似的還有郵局選址問題:與之類似,這次是要找出在居民點中郵局的最佳位置。很容易想到,這次不僅要確定y的坐標,還要確定x的坐標。當然均為其對應坐標的中位數;最終的計算結果,要求距離之和,即向量模的計算方法加和即可。

 (3)集合的划分

F(n,m)表示把n個元素的集合分為m個子集,有多少種分法?

 

n個元素的集合可以划為F(n,m)個不同的由m個非空子集組成的集合。

考慮3個元素的集合,可划分為:

① 1個子集的集合:{ {1,2,3} }

② 2個子集的集合:{{1,2} ,{3}}  ,  {{1,3},{2}}  ,  {{2,3},{1}}

③ 3個子集的集合:{{1},{2},{3}}

所以 F(3,1)=1

   F(3,2)=3

   F(3,3)=1

 如果要求F(4,2)該怎么辦呢?

A.往①里添加一個元素 {4} ,得到{{1,2,3},{4}}

B.往②里的任意一個子集添一個4,得到

{{1,2,4},{3}}  ,  {{1,2},{3,4}}

{{1,3,4},{2}}  ,  {{1,3},{2,4}}

{{2,3,4},{1}}  ,  {{2,3},{1,4}}

所以F(4,2) = F(3,1)+2*F(3,2) = 7

以此推廣得,F(n,m) =  F (n-1,m-1)+ m * F(n-1,m)

#include <stdio.h>

long long divide( int  n,int  m) {

  if (m==1 || m ==n){

    return 1;
  }else{

    return divide(n-1,m-1)+m*divide(n-1,m);
  }

}

int main(){

  int  n,m;

  while (scanf("%d%d",&n,&m) != EOF){

    printf("%I64d\n",divide(n,m));
  }

  return 0;

}

(4)求復雜度為O(lg n)的X的 n 次冪

 

#include "stdio.h"
#include "stdlib.h"

int power(int x, int n)
{
    int result;
    if(n == 1)
        return x;
    if( n % 2 == 0)
        result = power(x, n/2) * power(x, n / 2);
    else
        result = power(x, (n+1) / 2) * power(x, (n-1) / 2);

    return result;
}

int main()
{
    int x = 5;
    int n = 3;

    printf("power(%d,%d) = %d \n",x, n, power(x, n));
}

(5)二路歸並排序

描述:
時間復雜度是O(NlogN),空間復制度為O(N)(歸並排序的最大缺陷)
歸並排序(Merge Sort)完全遵循上述分治法三個步驟:
1、分解:將要排序的n個元素的序列分解成兩個具有n/2個元素的子序列;
2、解決:使用歸並排序分別遞歸地排序兩個子序列;
3、合並:合並兩個已排序的子序列,產生原問題的解。

數組代碼實現:

#include "stdio.h"
#include "stdlib.h"
#include "assert.h"
#include "string.h"

void print_arr(int *arr, int len)
{
    int i = 0;

    for(i = 0; i < len; i ++)
        printf("%d ",arr[i]);
    printf("\n");
}

void merge(int *arr, int low, int mid, int hight, int *tmp)
{
    assert(arr && low >= 0 && low <= mid && mid <= hight);


    int i = low;
    int j = mid + 1;
    int index = 0;

    while(i <= mid && j <= hight)
    {
        if(arr[i] <= arr[j])
            tmp[index++] = arr[i++];
        else
            tmp[index++] = arr[j++];
    }

    while(i <= mid) //拷貝剩下的左半部分
        tmp[index++] = arr[i++];

    while(j <= hight) //拷貝剩下的右半部分
        tmp[index++] = arr[j++];


    memcpy((void *)(arr + low), (void *)tmp, (hight - low + 1) * sizeof(int));



}

void mergesort(int *arr, int low, int hight, int *tmp)
{
    assert(arr && low >= 0);
    int mid;
    if(low < hight)
    {
        mid = (hight + low) >> 1;
        mergesort(arr, low, mid,tmp);
        mergesort(arr, mid + 1, hight,tmp);
        merge(arr, low, mid, hight,tmp);
    }
}
//只分配一次內存,避免內存操作開銷
void mergesort_drive(int *arr, int len)
{
    int *tmp = (int *)malloc(len * sizeof(int));
    if(!tmp)
    {
        printf("out of memory\n");
        exit(0);
    }

    mergesort(arr, 0, len - 1, tmp);

    free(tmp);
}

int main()
{
    int data[10]={8,7,2,6,9,10,3,4,5,1};

    int len = sizeof(data)/sizeof(data[0]);
    mergesort_drive(data, len);
    print_arr(data,len);

    return 0;
}

(6)整數划分問題

/*
整數划分問題
:將一個整數划分為若干個數相加
例子:
整數4 最大加數 4
4=4
1+3=4
1+1+2=4
2+2=4
1+1+1+1=4
一共五種划分方案
注意:1+3=4,3+1=4被認為是同一種划分方案
*/

#include<stdio.h>
int q(int n,int m)//n表示需要划分的數字,m表示最大的加數不超過m
{
    if(m==1||n==1)//只要存在一個為1,那么划分的方法數肯定只有一種,那就是n個1相加
    {
        return 1;
    }else if(n==m&&n>1)//二者相等且大於1的時候,問題等價於:q(n,n-1)+1;意味着將最大加數減一之后n的划分數,然后加一,最后面那個一代表的是:0+n,這個划分的方案
    {
        return q(n,n-1)+1;
    }else if(n<m)//如果m>n,那么令m=n就ok,因為最大加數在邏輯上不可能超過n
    {
        return q(n,n);
    }else if(n>m)
    {
        return q(n,m-1)+q(n-m,m);//分為兩種:划分方案沒有m的情況+划分方案有m的情況
    }
    return 0;
}
int main()
{
    printf("請輸入需要划分的數字和最大家數:\n");
    int n,m;
    scanf("%d %d",&n,&m);
    int r=q(n,m);
    printf("%d\n",r);
    return 0;
}

給你一個數,問你所有的划分方式,比如4,4=1+3,4=1+1+2,4=2+2,4=1+1+1+1

我們來分析一下,我們想用分治的話,就要找子問題,假設n是要划分的數,m說最大的加數,n=4,m=3

分解成兩類的子問題,一個是:一個是有m的情況,一個是沒有m的情況,然后將有m的情況繼續划分,分

解成有m-1和沒有m-1的情況,一直划分下去,直到m=1。比如n=4,m=3,划分成的子問題:有3,無

3,有2,無2,有1,無1(沒有意義,除非0+4=4),將這些子問題合並起來大問題就解決了。

九、總結   

    分治算法的一個核心在於子問題的規模大小是否接近,如果接近則算法效率較高。

    分治算法和動態規划都是解決子問題,然后對解進行合並;但是分治算法是尋找遠小於原問題的子問題(因為對於計算機來說計算小數據的問題還是很快的),同時分治算法的效率並不一定好,而動態規划的效率取決於子問題的個數的多少,子問題的個數遠小於子問題的總數的情況下(也就是重復子問題多),算法才會很高效。


免責聲明!

本站轉載的文章為個人學習借鑒使用,本站對版權不負任何法律責任。如果侵犯了您的隱私權益,請聯系本站郵箱yoyou2525@163.com刪除。



 
粵ICP備18138465號   © 2018-2025 CODEPRJ.COM