[劍指Offer] 數據流中的中位數


題目描述

如何得到一個數據流中的中位數?如果從數據流中讀出奇數個數值,那么中位數就是所有數值排序之后位於中間的數值。如果從數據流中讀出偶數個數值,那么中位數就是所有數值排序之后中間兩個數的平均值。
 
對於數據流,對應的就是在線算法了,一道很經典的題目就是在1億個數中找到最大的前100個數,這是一道堆應用題,找最大的前100個數,那么我們就創建一個大小為100的最小化堆,每來一個元素就與堆頂元素比較,因為堆頂元素是目前前100大數中的最小數,前來的元素如果比該元素大,那么就把原來的堆頂替換掉。
那么對於這一道題呢?如果單純的把所有元素放到一個數組里,每次查找中位數最快也要O(n),綜合下來是O(n^2)的復雜度。我們可以利用上面例子中的想法,用一個最大堆來維護當前前n/2小的元素,那么每次找中位數只到取出堆頂就可以了。但是,有一個問題,數據要動態增長,有可能之前被替換掉的元素隨着元素的增加又跑回來了,所以我們不能單純得向上題一樣把元素丟掉,我們可以再用一個最小化堆來存前n/2大的元素。
 1 #include <bits/stdc++.h>
 2 using namespace std;
 3 
 4 class Solution {
 5     private:
 6         vector<int> min; //數組中的后一半元素組成一個最小化堆
 7         vector<int> max; //數組中的前一半元素組成一個最大化堆
 8     public:
 9         void Insert(int num) {
10             if(((min.size()+max.size()) & 1) == 0) {  //偶數數據的情況下,則在最小堆中插入元素
11                 if(max.size() > 0 && num < max[0]) {
12                     max.push_back(num);
13                     push_heap(max.begin(), max.end(), less<int>());
14                     num=max[0];
15                     pop_heap(max.begin(), max.end(), less<int>());
16                     max.pop_back();
17                 }
18                 min.push_back(num); //把前一半找到的最大值放到后一半中
19                 push_heap(min.begin(), min.end(), greater<int>());
20             } else {
21                 if(min.size() > 0 && num > min[0]) {   //奇數數據的情況下,則在最大堆中插入元素
22                     min.push_back(num);
23                     push_heap(min.begin(), min.end(), greater<int>());
24                     num=min[0];
25                     pop_heap(min.begin(), min.end(), greater<int>());
26                     min.pop_back(); 
27                 }
28                 max.push_back(num); //把后一半找到的最大值放到前一半中
29                 push_heap(max.begin(), max.end(), less<int>());
30             }
31         }
32 
33         double GetMedian() { 
34             int size=min.size() + max.size();
35             if(size==0) return -1;
36             double median = 0;
37             if((size&1) != 0) {
38                 median = (double) min[0];
39             } else {
40                 median = (double) (max[0] + min[0]) / 2;
41             }
42             return median;
43         }
44 };
45 
46 int main() {
47     Solution s;
48     vector<int> v{5,2,3,4,1,6,7,0,8};
49     for (int i = 0; i < v.size(); ++i) {
50         s.Insert(v[i]);
51         cout << s.GetMedian() << endl;
52     }
53     return 0;
54 }

也可以使用multiset來簡化編程,lintcode上也有原題。

http://www.lintcode.com/en/problem/data-stream-median/

 1 class Solution {
 2 public:
 3     /**
 4      * @param nums: A list of integers.
 5      * @return: The median of numbers
 6      */
 7     vector<int> medianII(vector<int> &nums) {
 8         // write your code here
 9         multiset<int> left, right;
10         vector<int> res;
11         bool flag = true;
12         for (int n : nums) {
13             int tmp = n;
14             if (flag) {
15                 if (!right.empty() && n > *right.begin()) {
16                     right.insert(n);
17                     tmp = *right.begin();
18                     right.erase(right.find(tmp));
19                 }
20                 left.insert(tmp);
21             } else {
22                 if (!left.empty() && n < *left.rbegin()) {
23                     left.insert(n);
24                     tmp = *left.rbegin();
25                     left.erase(left.find(tmp));
26                 }
27                 right.insert(tmp);
28             }
29             flag = !flag;
30             res.push_back(*left.rbegin());
31         }
32         return res;
33     }
34 };

還有一道是求滑動窗口中的中位數,其實是基於同樣的思想。只是在窗口滑動時,會有元素滑出窗口,所以在插入新的元素之前先要把滑出窗口的元素刪除掉。

http://www.lintcode.com/en/problem/sliding-window-median/

 1 class Solution {
 2 public:
 3     /**
 4      * @param nums: A list of integers.
 5      * @return: The median of the element inside the window at each moving
 6      */
 7     vector<int> medianSlidingWindow(vector<int> &nums, int k) {
 8         // write your code here
 9         vector<int> res;
10         if (k > nums.size() || k == 0) return res;
11         multiset<int> left, right;
12         //init heaps by first kth elements in nums
13         for (int i = 0; i < k; ++i) {
14             left.insert(nums[i]);
15         }
16         while (left.size() > (k + 1) / 2) {
17             right.insert(*left.rbegin());
18             left.erase(left.find(*left.rbegin()));
19         }
20         res.push_back(*left.rbegin());
21         //slide window
22         for (int i = k; i < nums.size(); ++i) {
23             //delete the leftmost element in window from heaps
24             if (nums[i-k] > res.back()) right.erase(right.find(nums[i-k]));
25             else left.erase(left.find(nums[i-k]));
26             //insert new element into heaps
27             if (!left.empty() && nums[i] <= *left.rbegin()) left.insert(nums[i]);
28             else right.insert(nums[i]);
29             //adjust heaps so that the left heap contains (k + 1) / 2 elements
30             while (left.size() < (k + 1) / 2) {
31                 left.insert(*right.begin());
32                 right.erase(right.begin());
33             }
34             while (left.size() > (k + 1) / 2) {
35                 right.insert(*left.rbegin());
36                 left.erase(left.find(*left.rbegin()));
37             }
38             res.push_back(*left.rbegin());
39         }
40         return res;
41     }
42 };

 


免責聲明!

本站轉載的文章為個人學習借鑒使用,本站對版權不負任何法律責任。如果侵犯了您的隱私權益,請聯系本站郵箱yoyou2525@163.com刪除。



 
粵ICP備18138465號   © 2018-2025 CODEPRJ.COM