原文:數據量很大的排序問題 大量數據如何排序

某天參加阿里面試,技術面的時候,面試官問了排序問題: 問題一:若有 T的數據,比如 只有兩列,身份證號和姓名 需要實現由大到小排序,你用什么辦法,能否做到 復雜度為O n ,說說你的思路和想法 問題二:有 個G的數據,也是一樣,比如兩列,身份證號和姓名,如果兩條數據一樣,則表示該兩條數據重復了,現在給你 的內存,把這 G中重復次數最高的 條數據取出來。 我的思路是:這么大的數據,用普通的排序一定 ...

2017-07-16 15:40 0 7314 推薦指數:

查看詳情

怎樣對千萬級甚至億級數據量排序

編程珠璣第二版第一章就有類似的問題問題描述如下: 有最多1000萬條不同的整型數據存在於硬盤的文件中(數據不超過最大值),如何在1M內存的情況下對其進行盡可能快的排序。 (1)一個簡單的思路是讀1000萬條1次,對第i個25萬條數據進行排序,並將排好的結果存成外部文件i ...

Wed Jul 25 01:10:00 CST 2018 0 5487
千萬級甚至億級數據量排序

怎樣對千萬級甚至億級數據量排序 編程珠璣第二版第一章就有類似的問題問題描述如下: 有最多1000萬條不同的整型數據存在於硬盤的文件中(數據不超過最大值),如何在1M內存的情況下對其進行盡可 ...

Sun Mar 07 00:29:00 CST 2021 0 435
對大數據量進行排序--位圖法

題目:對2G的數據量進行排序,這是基本要求。 數據:1、每個數據不大於8億;2、數據類型位int;3、每個數據最多重復一次。 內存:最多用200M的內存進行操作。 我聽過很多種類似問題的解法,有的是內存多次利用,有的用到了外存,我覺得這兩種做法都不是比較好的思想,太慢。由於這個題目看起 ...

Fri Jul 28 02:37:00 CST 2017 0 4002
數據量很大,分頁查詢很慢,優化方案

參考文章: https://www.cnblogs.com/geningchao/p/6649907.html 當需要從數據庫查詢的表有上萬條記錄的時候,一次性查詢所有結果會變得很慢,特別是隨着數據量的增加特別明顯,這時需要使用分頁查詢。對於數據庫分頁查詢,也有很多種方法和優化的點。下面簡單 ...

Wed Sep 04 16:41:00 CST 2019 0 3010
數據量很大,分頁查詢很慢,優化方案

當需要從數據庫查詢的表有上萬條記錄的時候,一次性查詢所有結果會變得很慢,特別是隨着數據量的增加特別明顯,這時需要使用分頁查詢。對於數據庫分頁查詢,也有很多種方法和優化的點。下面簡單說一下我知道的一些方法。 准備工作 為了對下面列舉的一些優化進行測試,下面針對已有的一張表進行說明。 1、表名 ...

Wed Jul 03 00:03:00 CST 2019 0 2735
數據量排序算法 -最小堆排序算法

  今天有人推薦了一個排序算法:最小堆排序算法。號稱能處理10億數據排序問題.   正好將要面臨2.5億數據的查詢計算比對問題,從沒面對過如此大的數據量,之前處理過最大的表不過3000萬,心里正有些惴惴不安。正好把這個算法拿來學習揣摩一番。   剛開始隨手寫了個遞歸排序,本以為想法是比對一下 ...

Sat Jun 22 00:42:00 CST 2013 1 6894
 
粵ICP備18138465號   © 2018-2025 CODEPRJ.COM