原文:数据量很大的排序问题 大量数据如何排序

某天参加阿里面试,技术面的时候,面试官问了排序问题: 问题一:若有 T的数据,比如 只有两列,身份证号和姓名 需要实现由大到小排序,你用什么办法,能否做到 复杂度为O n ,说说你的思路和想法 问题二:有 个G的数据,也是一样,比如两列,身份证号和姓名,如果两条数据一样,则表示该两条数据重复了,现在给你 的内存,把这 G中重复次数最高的 条数据取出来。 我的思路是:这么大的数据,用普通的排序一定 ...

2017-07-16 15:40 0 7314 推荐指数:

查看详情

怎样对千万级甚至亿级数据量排序

编程珠玑第二版第一章就有类似的问题问题描述如下: 有最多1000万条不同的整型数据存在于硬盘的文件中(数据不超过最大值),如何在1M内存的情况下对其进行尽可能快的排序。 (1)一个简单的思路是读1000万条1次,对第i个25万条数据进行排序,并将排好的结果存成外部文件i ...

Wed Jul 25 01:10:00 CST 2018 0 5487
千万级甚至亿级数据量排序

怎样对千万级甚至亿级数据量排序 编程珠玑第二版第一章就有类似的问题问题描述如下: 有最多1000万条不同的整型数据存在于硬盘的文件中(数据不超过最大值),如何在1M内存的情况下对其进行尽可 ...

Sun Mar 07 00:29:00 CST 2021 0 435
对大数据量进行排序--位图法

题目:对2G的数据量进行排序,这是基本要求。 数据:1、每个数据不大于8亿;2、数据类型位int;3、每个数据最多重复一次。 内存:最多用200M的内存进行操作。 我听过很多种类似问题的解法,有的是内存多次利用,有的用到了外存,我觉得这两种做法都不是比较好的思想,太慢。由于这个题目看起 ...

Fri Jul 28 02:37:00 CST 2017 0 4002
数据量很大,分页查询很慢,优化方案

参考文章: https://www.cnblogs.com/geningchao/p/6649907.html 当需要从数据库查询的表有上万条记录的时候,一次性查询所有结果会变得很慢,特别是随着数据量的增加特别明显,这时需要使用分页查询。对于数据库分页查询,也有很多种方法和优化的点。下面简单 ...

Wed Sep 04 16:41:00 CST 2019 0 3010
数据量很大,分页查询很慢,优化方案

当需要从数据库查询的表有上万条记录的时候,一次性查询所有结果会变得很慢,特别是随着数据量的增加特别明显,这时需要使用分页查询。对于数据库分页查询,也有很多种方法和优化的点。下面简单说一下我知道的一些方法。 准备工作 为了对下面列举的一些优化进行测试,下面针对已有的一张表进行说明。 1、表名 ...

Wed Jul 03 00:03:00 CST 2019 0 2735
数据量排序算法 -最小堆排序算法

  今天有人推荐了一个排序算法:最小堆排序算法。号称能处理10亿数据排序问题.   正好将要面临2.5亿数据的查询计算比对问题,从没面对过如此大的数据量,之前处理过最大的表不过3000万,心里正有些惴惴不安。正好把这个算法拿来学习揣摩一番。   刚开始随手写了个递归排序,本以为想法是比对一下 ...

Sat Jun 22 00:42:00 CST 2013 1 6894
 
粤ICP备18138465号  © 2018-2025 CODEPRJ.COM