利用最小堆找出10億個數中最大的10000個數


最小堆

最小堆是一種完全二叉樹,特點是根節點比兩個子節點都小(或者根節點比子節點都大)

過程

  • 先找10000個數構建最小堆
  • 依次遍歷10億個數,如果比最小堆的最小值大,則替換這個最小值,並重新構建最小堆
  • 最后輸入10000個值
  • 時間復雜度
    構建最小堆的復雜度為 logn,求出最大m個數會構建m次最小堆,時間復雜度為 m logm, 這里m為10000
    進行n次時間復雜度為n,這里n為10億,總時間復雜度為 n m logm,即10億 10000 log 10000

其他算法

  • 將十億個數排序,找出最大值,但是占用空間比較大,做了很多無用功
  • 分治法:將10億個數分成10份,求出每份的前10000個數 ,然后在這個10 * 10000 個數中找出最大的10000個數
  • hash去重復,將這10億個數的Hash值進行比較,去除重復的


免責聲明!

本站轉載的文章為個人學習借鑒使用,本站對版權不負任何法律責任。如果侵犯了您的隱私權益,請聯系本站郵箱yoyou2525@163.com刪除。



 
粵ICP備18138465號   © 2018-2025 CODEPRJ.COM