尋找兩個有序數組的中位數 C++實現leetcode系列(四)


給定兩個大小為 m 和 n 的有序數組 nums1和 nums2

請你找出這兩個有序數組的中位數,並且要求算法的時間復雜度為 O(log(m + n))。

你可以假設 nums1 和 nums2 不會同時為空。

示例 1:

nums1 = [1, 3]
nums2 = [2]

則中位數是 2.0

示例 2:

nums1 = [1, 2]
nums2 = [3, 4]

則中位數是 (2 + 3)/2 = 2.5

這道題讓我們求兩個有序數組的中位數,而且限制了時間復雜度為 O(log (m+n)),看到這個時間復雜度,自然而然的想到了應該使用二分查找法來求解。但是這道題被定義為 Hard 也是有其原因的,難就難在要在兩個未合並的有序數組之間使用二分法,如果這道題只有一個有序數組,讓我們求中位數的話,估計就是個 Easy 題。對於這道題來說,我們可以將兩個有序數組混合起來成為一個有序數組再做嗎,圖樣圖森破,這個時間復雜度限制的就是告訴你金坷垃別想啦。那么我們還是要用二分法,而且是在兩個數組之間使用,感覺很高端啊。那么回顧一下中位數的定義,如果某個有序數組長度是奇數,那么其中位數就是最中間那個,如果是偶數,那么就是最中間兩個數字的平均值。這里對於兩個有序數組也是一樣的,假設兩個有序數組的長度分別為m和n,由於兩個數組長度之和 m+n 的奇偶不確定,因此需要分情況來討論,對於奇數的情況,直接找到最中間的數即可,偶數的話需要求最中間兩個數的平均值。為了簡化代碼,不分情況討論,我們使用一個小 trick,分別找第 (m+n+1) / 2 個,和 (m+n+2) / 2 個,然后求其平均值即可,這對奇偶數均適用。若 m+n 為奇數的話,那么其實 (m+n+1) / 2 和 (m+n+2) / 2 的值相等,相當於兩個相同的數字相加再除以2,還是其本身。

好,這里我們需要定義一個函數來在兩個有序數組中找到第K個元素,下面重點來看如何實現找到第K個元素。首先,為了避免拷貝產生新的數組從而增加時間復雜度,我們使用兩個變量i和j分別來標記數組 nums1 和 nums2 的起始位置。然后來處理一些 corner cases,比如當某一個數組的起始位置大於等於其數組長度時,說明其所有數字均已經被淘汰了,相當於一個空數組了,那么實際上就變成了在另一個數組中找數字,直接就可以找出來了。還有就是如果 K=1 的話,那么我們只要比較 nums1 和 nums2 的起始位置i和j上的數字就可以了。難點就在於一般的情況怎么處理?因為我們需要在兩個有序數組中找到第K個元素,為了加快搜索的速度,我們要使用二分法,那么對誰二分呢,數組么?其實要對K二分,意思是我們需要分別在 nums1 和 nums2 中查找第 K/2 個元素,注意這里由於兩個數組的長度不定,所以有可能某個數組沒有第 K/2 個數字,所以我們需要先 check 一下,數組中到底存不存在第 K/2 個數字,如果存在就取出來,否則就賦值上一個整型最大值。如果某個數組沒有第 K/2 個數字,那么我們就淘汰另一個數組的前 K/2 個數字即可。舉個例子來說吧,比如 nums1 = {3},nums2 = {2, 4, 5, 6, 7},K=4,我們要找兩個數組混合中第4個數字,那么我們分別在 nums1 和 nums2 中找第2個數字,我們發現 nums1 中只有一個數字,不存在第二個數字,那么 nums2 中的前2個數字可以直接跳過,為啥呢,因為我們要求整個混合數組的第4個數字,不管 nums1 中的那個數字是大是小,第4個數字絕不會出現在 nums2 的前兩個數字中,所以可以直接跳過。

有沒有可能兩個數組都不存在第 K/2 個數字呢,這道題里是不可能的,因為我們的K不是任意給的,而是給的 m+n 的中間值,所以必定至少會有一個數組是存在第 K/2 個數字的。最后就是二分法的核心啦,比較這兩個數組的第 K/2 小的數字 midVal1 和 midVal2 的大小,如果第一個數組的第 K/2 個數字小的話,那么說明我們要找的數字肯定不在 nums1 中的前 K/2 個數字,所以我們可以將其淘汰,將 nums1 的起始位置向后移動 K/2 個,並且此時的K也自減去 K/2,調用遞歸,舉個例子來說吧,比如 nums1 = {1, 3},nums2 = {2, 4, 5},K=4,我們要找兩個數組混合中第4個數字,那么我們分別在 nums1 和 nums2 中找第2個數字,nums1 中的第2個數字是3,nums2 中的第2個數字是4,由於3小於4,所以混合數組中第4個數字肯定在 nums2 中,所以我們可以將 nums1 的起始位置向后移動 K/2 個。反之,我們淘汰 nums2 中的前 K/2 個數字,並將 nums2 的起始位置向后移動 K/2 個,並且此時的K也自減去 K/2,調用遞歸即可,參見代碼如下:

 

 

C++ 解法一:

 
class Solution {
public:
    double findMedianSortedArrays(vector<int>& nums1, vector<int>& nums2) {
        int m = nums1.size(), n = nums2.size(), left = (m + n + 1) / 2, right = (m + n + 2) / 2;
        return (findKth(nums1, 0, nums2, 0, left) + findKth(nums1, 0, nums2, 0, right)) / 2.0;
    }
    int findKth(vector<int>& nums1, int i, vector<int>& nums2, int j, int k) {
        if (i >= nums1.size()) return nums2[j + k - 1];
        if (j >= nums2.size()) return nums1[i + k - 1];
        if (k == 1) return min(nums1[i], nums2[j]);
        int midVal1 = (i + k / 2 - 1 < nums1.size()) ? nums1[i + k / 2 - 1] : INT_MAX;
        int midVal2 = (j + k / 2 - 1 < nums2.size()) ? nums2[j + k / 2 - 1] : INT_MAX;
        if (midVal1 < midVal2) {
            return findKth(nums1, i + k / 2, nums2, j, k - k / 2);
        } else {
            return findKth(nums1, i, nums2, j + k / 2, k - k / 2);
        }
    }
};
 

 

Java 解法一:

 
public class Solution {
    public double findMedianSortedArrays(int[] nums1, int[] nums2) {
        int m = nums1.length, n = nums2.length, left = (m + n + 1) / 2, right = (m + n + 2) / 2;
        return (findKth(nums1, 0, nums2, 0, left) + findKth(nums1, 0, nums2, 0, right)) / 2.0;
    }
    int findKth(int[] nums1, int i, int[] nums2, int j, int k) {
        if (i >= nums1.length) return nums2[j + k - 1];
        if (j >= nums2.length) return nums1[i + k - 1];
        if (k == 1) return Math.min(nums1[i], nums2[j]);
        int midVal1 = (i + k / 2 - 1 < nums1.length) ? nums1[i + k / 2 - 1] : Integer.MAX_VALUE;
        int midVal2 = (j + k / 2 - 1 < nums2.length) ? nums2[j + k / 2 - 1] : Integer.MAX_VALUE;
        if (midVal1 < midVal2) {
            return findKth(nums1, i + k / 2, nums2, j, k - k / 2);
        } else {
            return findKth(nums1, i, nums2, j + k / 2, k - k / 2);
        }
    }
}
 

 

上面的解法一直使用的是原數組,同時用了兩個變量來分別標記當前的起始位置。我們也可以直接生成新的數組,這樣就不要用起始位置變量了,不過拷貝數組的操作可能會增加時間復雜度,也許會超出限制,不過就算當個思路拓展也是極好的。首先我們要判斷數組是否為空,為空的話,直接在另一個數組找第K個即可。還有一種情況是當 K = 1 時,表示我們要找第一個元素,只要比較兩個數組的第一個元素,返回較小的那個即可。這里我們分別取出兩個數組的第 K/2 個數字的位置坐標i和j,為了避免數組沒有第 K/2 個數組的情況,我們每次都和數組長度做比較,取出較小值。這里跟上面的解法有些許不同,上面解法我們直接取出的是值,而這里我們取出的是位置坐標,但是思想都是很類似的。不同在於,上面解法中我們每次固定淘汰 K/2 個數字,而這里我們由於取出了合法的i和j,所以我們每次淘汰i或j個。評論區有網友提出,可以讓 j = k-i,這樣也是對的,可能還更好一些,收斂速度可能會更快一些,參見代碼如下:

 

C++ 解法二:

 
class Solution {
public:
    double findMedianSortedArrays(vector<int>& nums1, vector<int>& nums2) {
        int m = nums1.size(), n = nums2.size();
        return (findKth(nums1, nums2, (m + n + 1) / 2) + findKth(nums1, nums2, (m + n + 2) / 2)) / 2.0;
    }
    int findKth(vector<int> nums1, vector<int> nums2, int k) {
        if (nums1.empty()) return nums2[k - 1];
        if (nums2.empty()) return nums1[k - 1];
        if (k == 1) return min(nums1[0], nums2[0]);
        int i = min((int)nums1.size(), k / 2), j = min((int)nums2.size(), k / 2);
        if (nums1[i - 1] > nums2[j - 1]) {
            return findKth(nums1, vector<int>(nums2.begin() + j, nums2.end()), k - j);
        } else {
            return findKth(vector<int>(nums1.begin() + i, nums1.end()), nums2, k - i);
        }
        return 0;
    }
};
 

 

Java 解法二:

 
public class Solution {
    public double findMedianSortedArrays(int[] nums1, int[] nums2) {
        int m = nums1.length, n = nums2.length, left = (m + n + 1) / 2, right = (m + n + 2) / 2;
        return (findKth(nums1, nums2, left) + findKth(nums1, nums2, right)) / 2.0;
    }
    int findKth(int[] nums1, int[] nums2, int k) {
        int m = nums1.length, n = nums2.length;
        if (m == 0) return nums2[k - 1];
        if (n == 0) return nums1[k - 1];
        if (k == 1) return Math.min(nums1[0], nums2[0]);
        int i = Math.min(m, k / 2), j = Math.min(n, k / 2);
        if (nums1[i - 1] > nums2[j - 1]) {
            return findKth(nums1, Arrays.copyOfRange(nums2, j, n), k - j);
        } else {
            return findKth(Arrays.copyOfRange(nums1, i, m), nums2, k - i);
        }
    }
}
 

 

此題還能用迭代形式的二分搜索法來解,是一種相當巧妙的應用,講解在這個帖子中寫的十分清楚,等有時間我再來寫寫分析過程:

 

C++ 解法三:

 
class Solution {
public:
    double findMedianSortedArrays(vector<int>& nums1, vector<int>& nums2) {
        int m = nums1.size(), n = nums2.size();
        if (m < n) return findMedianSortedArrays(nums2, nums1);
        if (n == 0) return ((double)nums1[(m - 1) / 2] + (double)nums1[m / 2]) / 2.0;
        int left = 0, right = n * 2;
        while (left <= right) {
            int mid2 = (left + right) / 2;
            int mid1 = m + n - mid2;
            double L1 = mid1 == 0 ? INT_MIN : nums1[(mid1 - 1) / 2];
            double L2 = mid2 == 0 ? INT_MIN : nums2[(mid2 - 1) / 2];
            double R1 = mid1 == m * 2 ? INT_MAX : nums1[mid1 / 2];
            double R2 = mid2 == n * 2 ? INT_MAX : nums2[mid2 / 2];
            if (L1 > R2) left = mid2 + 1;
            else if (L2 > R1) right = mid2 - 1;
            else return (max(L1, L2) + min(R1, R2)) / 2;
        }
        return -1;
    }
};
 

 

Java 解法三:

 
public class Solution {
    public double findMedianSortedArrays(int[] nums1, int[] nums2) {
        int m = nums1.length, n = nums2.length;
        if (m < n) return findMedianSortedArrays(nums2, nums1);
        if (n == 0) return (nums1[(m - 1) / 2] + nums1[m / 2]) / 2.0;
        int left = 0, right = 2 * n;
        while (left <= right) {
            int mid2 = (left + right) / 2;
            int mid1 = m + n - mid2;
            double L1 = mid1 == 0 ? Double.MIN_VALUE : nums1[(mid1 - 1) / 2];
            double L2 = mid2 == 0 ? Double.MIN_VALUE : nums2[(mid2 - 1) / 2];
            double R1 = mid1 == m * 2 ? Double.MAX_VALUE : nums1[mid1 / 2];
            double R2 = mid2 == n * 2 ? Double.MAX_VALUE : nums2[mid2 / 2];
            if (L1 > R2) left = mid2 + 1;
            else if (L2 > R1) right = mid2 - 1;
            else return (Math.max(L1, L2) + Math.min(R1, R2)) / 2;
        }
        return -1;
    }
}

 

參考資料:


免責聲明!

本站轉載的文章為個人學習借鑒使用,本站對版權不負任何法律責任。如果侵犯了您的隱私權益,請聯系本站郵箱yoyou2525@163.com刪除。



 
粵ICP備18138465號   © 2018-2025 CODEPRJ.COM