原文:大数据量的排序算法 -最小堆排序算法

今天有人推荐了一个排序算法:最小堆排序算法。号称能处理 亿数据的排序问题. 正好将要面临 . 亿数据的查询计算比对问题,从没面对过如此大的数据量,之前处理过最大的表不过 万,心里正有些惴惴不安。正好把这个算法拿来学习揣摩一番。 刚开始随手写了个递归排序,本以为想法是比对一下 种算法的,后来发现结果大跌眼镜。 下表中,表头是随机数量,内容单位为毫秒。 最小堆排序算法 递归排序 自己写的递归算法只能 ...

2013-06-21 16:42 1 6894 推荐指数:

查看详情

最小堆排序MinHeap

MinHeap基本性质 最小堆中的最小元素值出现在根结点(堆顶); 堆中每个父节点的元素值都小于等于其孩子结点(如果存在) MinHeap用途 1.求一个数列中的第K大的数,建立一个大小为K的最小堆,堆顶就是第K大的数 2.递归去除最顶元素,用于取top K ...

Tue Oct 24 03:55:00 CST 2017 0 4514
大数据量进行排序--位图法

题目:对2G的数据量进行排序,这是基本要求。 数据:1、每个数据不大于8亿;2、数据类型位int;3、每个数据最多重复一次。 内存:最多用200M的内存进行操作。 我听过很多种类似问题的解法,有的是内存多次利用,有的用到了外存,我觉得这两种做法都不是比较好的思想,太慢。由于这个题目看起 ...

Fri Jul 28 02:37:00 CST 2017 0 4002
大数据量算法面试题

作者:July、youwang、yanxionglu。时间:二零一一年三月二十六日说明:本文分为俩部分,第一部分为10道海量数据处理的面试题,第二部分为10个海量数据处理的方法总结。有任何问题,欢迎交流、指正。出处:http://blog.csdn.net/v_JULY_v。 第一部 ...

Mon May 20 02:46:00 CST 2013 0 7620
排序算法——堆排序

前一阵子一直在写排序的系列文章,最近因为一些事情耽搁了几天,也穿插了几篇其他类别的随笔。今天还是回到排序上面来,善始善终,呵呵。今天要介绍的也是一种效率很高的排序——堆排序思想堆排序,顾名思义,就是基于堆。因此先来介绍一下堆的概念。堆分为最大堆和最小堆,其实就是完全二叉树。最大堆要求节点的元素都要 ...

Thu Mar 08 17:46:00 CST 2012 5 21442
排序算法堆排序

堆排序 其他排序方法:选择排序、冒泡排序、归并排序、快速排序、插入排序、希尔排序堆排序 概念 完全二叉树 在讲完全二叉树之前,先引入完美二叉树/满二叉树的概念。 每一个层的结点数都达到最大值的二叉树就叫完美二叉树。就像这样: 而完全二叉树的结点也像上图的满二叉树那样从上往下 ...

Wed Mar 04 23:02:00 CST 2020 0 742
多线程外排序解决大数据排序问题2(最小堆并行k路归并)

转自:AIfred 事实证明外排序的效率主要依赖于磁盘,归并阶段采用K路归并可以显著减少IO最小堆并行k路归并,效率倍增。 二路归并的思路会导致非常多冗余的磁盘访问,两组两组合并确定的是当前的相对位置并不能一次确定最终的位置。 K路归并,每一轮归并直接确定的是最终的位置,不用重复访问 ...

Thu Sep 06 01:02:00 CST 2018 0 1431
堆排序算法详解

1、堆排序概述 堆排序(Heapsort)是指利用堆积树(堆)这种数据结构所设计的一种排序算法,它是选择排序的一种。可以利用数组的特点快速定位指定索引的元素。堆分为大根堆和小根堆,是完全二叉树。大根堆的要求是每个节点的值都不大于其父节点的值,即A[PARENT[i]] >= A[i]。在数 ...

Thu Nov 19 17:58:00 CST 2015 0 3789
 
粤ICP备18138465号  © 2018-2025 CODEPRJ.COM