隨機選擇算法和快速排序原理相似,所以有時候也稱作“快速選擇算法”,一般選擇問題可以證明都能在O(n)時間內完成。隨機選擇算法的期望運行時間為線性時間,即Θ(n),但其最壞情況運行時間為O(n^2)。最壞情況與快排一樣,都是運氣不好導致划分不均勻。
代碼:
#include "stdafx.h"
#include <iostream>
#include <vector>
#include <stdlib.h>
class QuicklySelect {
public:
template<class T>
void swap(T & a, T & b)
{
T tem = a;
a = b;
b = tem;
}
int Partition(std::vector<int> & nums, int start, int end)
{
int tem = nums[end];
int i = start - 1;
for (int j = start; j < end; j++)
{
if (nums[j] <= tem)
{
i += 1;
swap(nums[i], nums[j]);
}
}
swap(nums[i + 1], nums[end]);
return i + 1;
}
int RandomizedPartition(std::vector<int> & nums, int start, int end)
{
int i = start + rand() % (end - start);
swap(nums[i], nums[end]);
return Partition(nums, start, end);
}
int RandomizedSelect(std::vector<int> & nums, int start, int end, int i)
{
if (nums.empty()) return 0;
if (start == end) return nums[start];
int mid = RandomizedPartition(nums, start, end);
int k = mid - start + 1;
if (i == k)
return nums[mid];
else if (i < k)
return RandomizedSelect(nums, start, mid - 1, i);
else
return RandomizedSelect(nums, mid + 1, end, i - k);
}
};
int main()
{
std::vector<int> nums { 5,3,1,4,2 };//5 3 1 2 4
std::cout << "結果:" << QuicklySelect().RandomizedSelect(nums, 0, nums.size() - 1, nums.size() + 1 - 2) << std::endl;
getchar();
return 0;
}
運行結果:

即4是數組中第2大,第4小的數。
算法題:給定一個大小為n的一維無序數組,從數組中找出前k個最大數,最佳時間復雜度是多少?實際應用中我能想到比如網易雲的聽歌排行榜會列舉出聽歌次數最多的前100首歌曲。
這題我是在刷知乎時看到的:https://www.zhihu.com/question/268385292/answer/336806597
若不要求對top k 進行排序,則利用隨機選擇算法可使期望運行時間達到Θ(n),空間復雜度O(k);若排序則運行時間為Θ(n + klogk),當最壞情況為找所有最大數並排序時,就是排序了,利用快排則時間復雜度為Θ(nlgn)
代碼:
#include "stdafx.h"
#include <iostream>
#include <vector>
#include <stdlib.h>
class QuicklySelect {
public:
template<class T>
void swap(T & a, T & b)
{
T tem = a;
a = b;
b = tem;
}
int Partition(std::vector<int> & nums, int start, int end)
{
int tem = nums[end];
int i = start - 1;
for (int j = start; j < end; j++)
{
if (nums[j] <= tem)
{
i += 1;
swap(nums[i], nums[j]);
}
}
swap(nums[i + 1], nums[end]);
return i + 1;
}
int RandomizedPartition(std::vector<int> & nums, int start, int end)
{
int i = start + rand() % (end - start);
swap(nums[i], nums[end]);
return Partition(nums, start, end);
}
int RandomizedSelect(std::vector<int> & nums, int start, int end, int i)
{
if (nums.empty()) return 0;
if (start == end) return nums[start];
int mid = RandomizedPartition(nums, start, end);
int k = mid - start + 1;
if (i == k)
return nums[mid];
else if (i < k)
return RandomizedSelect(nums, start, mid - 1, i);
else
return RandomizedSelect(nums, mid + 1, end, i - k);
}
std::vector<int> Top(std::vector<int> nums, int k)
{
std::vector<int> top;
top.push_back(RandomizedSelect(nums, 0, nums.size() - 1, nums.size() + 1 - k));
for (int i = 0; i < nums.size(); i++)
{
if (nums[i] > top[0])
top.push_back(nums[i]);
}
return top;
}
};
int main()
{
std::vector<int> nums { 5345,332,2341,498,248,89,239,4825,8,43,9892,872,1843 };
std::vector<int> top = QuicklySelect().Top(nums, 5);
for (int i = top.size() - 1; i >= 0; i--)
std::cout << "top" << top.size() - i << ':' << top[i] << std::endl;
getchar();
return 0;
}
記得知乎大多數同學使用的是建最大堆的方法,說是時間復雜度為O(nlgk),空間復雜度為O(k),改天試一試。時間復雜度應該還可以優化。
