最小堆
最小堆是一種完全二叉樹,特點是根節點比兩個子節點都小(或者根節點比子節點都大)
過程
- 先找10000個數構建最小堆
- 依次遍歷10億個數,如果比最小堆的最小值大,則替換這個最小值,並重新構建最小堆
- 最后輸入10000個值
- 時間復雜度
構建最小堆的復雜度為 logn,求出最大m個數會構建m次最小堆,時間復雜度為 m logm, 這里m為10000
進行n次時間復雜度為n,這里n為10億,總時間復雜度為 n m logm,即10億 10000 log 10000
其他算法
- 將十億個數排序,找出最大值,但是占用空間比較大,做了很多無用功
- 分治法:將10億個數分成10份,求出每份的前10000個數 ,然后在這個10 * 10000 個數中找出最大的10000個數
- hash去重復,將這10億個數的Hash值進行比較,去除重復的
