九章算法系列(#2 Binary Search)-課堂筆記


前言

先說一些題外的東西吧。受到春躍大神的影響和啟發,推薦了這個算法公開課給我,晚上睡覺前點開一看發現課還有兩天要開始,本着要好好系統地學習一下算法,於是就爬起來拉上兩個小伙伴組團報名了。今天聽了第一節課,說真的很實用,特別是對於我這種算法不扎實,並且又想找工作,提高自己的情況。 那就不多說廢話了,以后每周都寫個總結吧,就趁着這一個月好好把算法提高一下。具體就從:課堂筆記、leetcode和lintcode相關習題、hdu和poj相關習題三個方面來寫吧。希望自己能夠堅持下來,給大家分享一些好的東西。

 

 outline:

  • 第一境界:會寫程序
    • Find First Position of Target
    • Find Last Position of Target
  • 第二境界:找到第一個/最后一個滿足某個條件的位置/值
    • Search a 2D Matrix
    • Find Minimum in Rotated Sorted Array
  • 第三境界:保留有解的那一半
    • Find Peak Element

 

 

課堂筆記

二分查找這類題以前接觸的也算是比較多的了,所以還算相對熟悉,但今天聽老師講過以后,還是覺得有了很多新的認識,最有印象的就是令狐老師講的三個境界:

 


 

1. 第一境界:會寫程序

這個境界我自認為在刷了那么多leetcode之后算是沒有問題的了,套了不少模版,雖然還有一些邊界問題考慮不周全,但是經過調試,應該沒有什么問題,經過幾次面試,也面到過Binary Seach。想必大家也有很好的基礎。 正如老師說的,這個境界還是存在一些問題,比如解決二分程序的三大痛點、權衡遞歸與非遞歸。 對於第一個問題,其實就是start和end的位置選取,比如容易進入死循環,或者容易分不清楚到底應該是start = mid還是start = mid+ 1等。以下給出一個代碼模版,這個也是我之前寫二分問題經常會寫的樣子:

int start = 0, end = nums.size() - 1;
while (start < end){
    int mid = (start + end)/2;
    if (...) {...}
    else if (...) {...}
    else {...}
}

 想必大家都會把循環條件寫成start < end或者start <= end這樣的,這樣在一些情況下也確實沒有問題(這里直接上一個題):

  Find First Position of Target

  http://www.lintcode.com/zh-cn/problem/first-position-of-target/

給定一個排序的整數數組(升序)和一個要查找的整數target,用O(logn)的時間查找到target第一次出現的下標(從0開始),如果target不存在於數組中,返回-1

樣例

在數組 [1, 2, 3, 3, 4, 5, 10] 中二分查找3,返回2

這個題應該是Binary Search最基礎的題,直接套用模版就可以,以下是這個題的代碼(Bug Free):

    int binarySearch(vector<int> &array, int target) {
        if (!array.size()) return -1;
        int start = 0, end = array.size() - 1;
        while (start < end) {
            int mid = (start + end) >> 1;
            if (array[mid] < target) {
                start = mid + 1;
            } else if (array[mid] > target) {
                end = mid -1;
            } else {
                end = mid;
            }
        }
        if (array[start] == target) return start;
        return -1;
    }

 

因為比較簡單,就不再多說了,這里需要注意的幾個點是,int mid = (start + end) >>1;其實就是int mid = (start + end)/2;因為在面試中如果會位運算的話,還是能夠給面試官留下很好的印象。有的人說直接加起來除以2會溢出,其實start和end不會大到超過int的最大值的,因為一個vector也不會去開辟那么大的空間,但是寫成`int mid = (end - start)/2 + start;`也能顯得你比較不錯。綜上,兩種方法都可以。 在這個題中因為是找第一個與target相等的值,所以用這種方法不會出問題,但是在考慮下面的題,就會出現問題:

  Find Last Position of Target

  http://www.lintcode.com/zh-cn/problem/last-position-of-target/

給一個升序數組,找到target最后一次出現的位置,如果沒出現過返回-1

樣例

給出 [1, 2, 2, 4, 5, 5].

target = 2, 返回 2.

target = 5, 返回 5.

target = 6, 返回 -1.

 錯誤代碼如下:

while (start < end) {
        int mid = ( start + end ) >>1;
        if (A[mid] < target) {
       start = mid + 1;
     }
else if ( A[mid] > target) {
       end = mid -1;
     }
else {
       start = mid;
     } }

這里如果這樣寫的話,代碼就會進入死循環,因為在求mid的時候是向左邊取整的。考慮這樣的一個情況[...,5,5],假設target為5,那么start就會一直向右靠近,最后到n-2的位置,而end此時為n-1,再次進入循環mid等於n-2,所以就進入了死循環。 根據課上老師所說的,建議大家寫成start + 1 < end,最后再判斷start和end(按照所需先后判斷)即可,這種寫法適用於所有的情況,不容易出現問題。 ps. 這里把條件寫成如下也可行:

while (start + 1 < end) {
    int mid = (start + end)>>1;
    if (A[mid] > target) {
    end = mid; } else {
    start = mid;
  } }

因為start和end不管是否包括mid值都不影響最后的結果。 這個境界需要理解一個重點: 二分法實際上就是把區間變小的問題,把一個長度為n的區間變為n/2,然后再變小,即:

T(n) = T(n/2) + O(1) = O(logn)

通過O(1)的時間,把規模為n的問題變為n/2 當面試的時候,有O(n)的解,如果面試官需要你進一步優化,那么很大可能就是需要用二分O(logn)的方法來做。 實際上的步驟:

**區間縮小-> 剩下兩個下標->判斷兩個下標**

**注:不要把縮小區間和得到答案放在一個循環里面,容易出問題,增加難度**

 


 

 2. 第二境界:找到第一個/最后一個滿足某個條件的位置/值

這個境界就是第一個境界的進階版本,就是能夠把一些實際的應用問題轉換為二分的核心問題:把具體的問題轉變為找到數組中的第一個/最后一個滿足某個條件的位置/值。 
就不多說了,直接上題吧:
  Seach a 2D Matrix

寫出一個高效的算法來搜索 m × n矩陣中的值。

這個矩陣具有以下特性:

  • 每行中的整數從左到右是排序的。
  • 每行的第一個數大於上一行的最后一個整數。

樣例

考慮下列矩陣:

[
  [1, 3, 5, 7],
  [10, 11, 16, 20],
  [23, 30, 34, 50]
]

給出 target = 3,返回 true

這道題最簡單的方式就是對每一行進行一次二分查找,第一行沒有找到就找第二行,以此類推,那么時間復雜度為0(nlogn)。 如果需要再進行優化,那么可以這樣考慮:因為條件中有每行的第一個數大於上一行的最后一個整數。所以我們可以先對每行的第一個數來進行一個二分查找,找到最后一個不大於target的數(注意這里是二分查找的核心思想)然后再對這一行進行二分查找即可,這樣首先對每行的第一個數查找復雜度為0(logn),再對某一行進行查找,復雜度為O(logn),所以為O(logn)。代碼如下(Bug Free):
bool searchMatrix(vector<vector<int> > &matrix, int target) {
    if (!matrix.size()||!matrix[0].size()) return false;
    int start = 0, end = matrix.size() - 1;
    while (start + 1 < end) {
        int mid = (end - start)/2 + start;
        if (matrix[mid][0] < target) start = mid;
        else end = mid;
    }
    int new_start = 0,new_end = matrix[0].size()-1;
    int index = matrix[end][0] <= target ?end:start;
    while (new_start + 1 < new_end) {
        int mid = (new_end - new_start)/2 + new_start;
        if (matrix[index][mid] > target) new_end = mid;
        else if (matrix[index][mid] < target)
            new_start = mid;
        else return true;
    }
    if (matrix[index][new_end] == target) return true;
    if (matrix[index][new_start] == target) return true;
    return false;
}
這個題關鍵在於要對兩個端點的把握,還是二分查找的基本流程:先縮小區間,然后對兩個剩余的端點進行判斷。
當然這個題也有不需要進行兩次計算的方法,因為當前行的所有元素嚴格大於第一行,所以可以把矩陣考慮為一維的數組,只需要在切換的時候進行一個行和列的轉換即可,具體代碼如下(Bug Free):
    bool searchMatrix(vector<vector<int> > &matrix, int target) {
        if (!matrix.size()||!matrix[0].size()) return false;
        int m = matrix.size();
        int n = matrix[0].size();
        int start = 0, end = n * m - 1;
        while (start + 1 < end) {
            int mid = (end - start)/2 + start;
            int x = mid / n;
            int y = mid % n;
            if (matrix[x][y] > target) {
                end = mid;
            } else {
                start = mid;
            }
        }
        int x = start / n;
        int y = start % n;
        if (matrix[x][y] == target) {
            return true;
        }
        x = end / n;
        y = end % n;
        if (matrix[x][y] == target) {
            return true;
        }
        return false;
    }

 

再來一個題吧:
  Find Minimum in Rotated Sorted Array

假設一個旋轉排序的數組其起始位置是未知的(比如0 1 2 4 5 6 7 可能變成是4 5 6 7 0 1 2)。

你需要找到其中最小的元素。

你可以假設數組中不存在重復的元素。

樣例

給出[4,5,6,7,0,1,2]  返回 0

這個題如果按照我以前的想法,就是最直觀的辦法:直接從頭遍歷,發現某一個值小於前一個值,並且小於后一個值,那么這個值就是最小的。這樣的復雜度就是O(n),我記得有一次面試的時候就是這么回答了,然后遭到了面試官無情的鄙視。 這里使用二分的話,是非常有技巧的,這個技巧也是對於之后難一些的題來說需要掌握的,我們要時刻不能忘記二分的宗旨:把具體的問題轉變為找到數組中的額第一個/最后一個滿足某個條件的位置/值。這題其實可以這么考慮:由最小值為中心把兩邊分開,兩邊都是遞增的,而后一部分的最大值也嚴格小於前一部分的所有值,顯然,最后一部分的最大值就是num[n-1]那么我們只需要找到比這個值小的第一個值即可。這里是不是又回到了最原始的問題。代碼如下(Bug Free):
    int findMin(vector<int> &num) {
        if (!num.size()) return 0;
        int start = 0, end = num.size() - 1;
        int target = num[end];
        while (start + 1 < end) {
            int mid = (end - start)/2 + start;
            if (num[mid] <= target) {
                end = mid;
            }
            else {
                start = mid;
            }
        }
        if (num[start] <= target) {
            return num[start];
        }
        else {
            return num[end];
        }
    }
這題稍微有一些和之前不一樣的地方,就是在兩個部分之間進行了一個權衡,在start和end的變換的地方,需要大家注意。
 

 
3. 第三境界:保留有解的那一半
 
有了前面兩個階段的鋪墊,達到一定的訓練以后,應該也差不多能夠熟練掌握中等和簡單的題了,其實足夠深刻地理解了二分的精髓以后,可以把幾個習題都做一遍,盡量還是達到Bug Free的級別吧(這里所說的Bug Free是指能夠不用編譯器的情況下,直接空手寫代碼,用眼睛和筆來調試,最后提交后Accepted)。
第三個階段呢,其實就是回到了二分本身的定義,我的理解就是:二分法其實就是把問題不斷縮小為原來的n/2,然后再找到相應的位置進行處理。那么二分法的最高境界就是學會去 保留有答案的那一半,也許你心里會想:這個我本來就知道啊,但是真正到了實際操作的時候,還是會有搞不清楚的時候。貼出一道題:
   Find Peak Element

給出一個整數數組(size為n),其具有以下特點:

  • 相鄰位置的數字是不同的
  • A[0] < A[1] 並且 A[n - 2] > A[n - 1]

假定P是峰值的位置則滿足A[P] > A[P-1]A[P] > A[P+1],返回數組中任意一個峰值的位置。

樣例

給出數組[1, 2, 1, 3, 4, 5, 7, 6]返回1, 即數值 2 所在位置, 或者6, 即數值 7 所在位置.

這個題算是比較簡單的題,但是重要的是理解其中的思想,還是回到二分法第三個階段的核心: 保留有答案的那一半。這道題只是要求找到其中一個峰值即可。峰值滿足的條件就是左邊的部分是單調遞增的,而右邊的部分是單調遞減的(如果該點可導,並且導數為0,那么這個點就是峰值),我們很容易在紙上畫出來某個點的四種情況(如下圖所示):

 

第一種情況:當前點就是峰值,直接返回當前值。

第二種情況:當前點是谷點,不論往那邊走都可以找到峰值。

第三種情況:當前點處於下降的中間,往左邊走可以到達峰值。

第四種情況:當前點處於上升的中間,往右邊走可以達到峰值。

分析了四種情況,那么就容易把有答案的一半保留下來了,接下來就判斷是否能夠找到峰值即可。代碼如下(Bug Free):

  int findPeak(vector<int> A) {
      if (!A.size()) return 0;
      int start = 0;
      int end = A.size() -1;
      while (start + 1 < end) {
          int mid = (end - start)/2 + start;
          if (A[mid] > A[mid - 1] && A[mid] > A[mid + 1]) {
              return mid;
          } else if (A[mid] <= A[mid+1] && A[mid] >= A[mid -1]) {
              start = mid;
          } else if (A[mid] >= A[mid+1] && A[mid] <= A[mid -1]) {
              end = mid;
          } else {
              start = mid;
          }
      }
      if (start >= 1 && A[start] > A[start - 1] && A[start] > A[start + 1]) return start;
if (end <= A.size()-2 && A[end] > A[end-1] && A[end] > A[end+1]) return end; }

這道題的難點其實就是把各種情況考慮一下,然后把有答案的部分保留下來,基本上就沒有問題了。

 


 

總結

本文只是挑選了一些比較好的課上的題進行了講解,還有部分題沒有寫出來,也會在后續的博客中。

對於我個人而言,二分法算是比較熟悉的一個方法,之前在做微軟校招第一題的時候用的就是二分的方法。在面試中也是比較常用到的一種方法,因為總有那么一種說法嘛:比0(n)還要快的算法復雜度,那必須就是0(logn)了(這里說的是在一般的面試情況下)那么O(logn)就必然要考慮二分的方法來做了。一般都會與一些排序的序列、在一段有規則的序列等情況中找到符合某個條件的位置/值。這個模塊還是需要多練習,然后就能夠很好上手了,如果想要能夠在算法面試中有更好的突破,還是需要去解決一些難一點的題,諸如poj或者hdu這樣的應用場景的題。

 

這也是本人第一次認真寫一個技術長文,雖然也沒有什么特別深奧的東西,讀到這里說明你也是很給我面子的了,之后還會繼續更新一些自己的想法和一些好的題目,希望大家多多支持!


免責聲明!

本站轉載的文章為個人學習借鑒使用,本站對版權不負任何法律責任。如果侵犯了您的隱私權益,請聯系本站郵箱yoyou2525@163.com刪除。



 
粵ICP備18138465號   © 2018-2025 CODEPRJ.COM