Java8 Arrays.sort VS Arrays.parallelSort

本文转载自查看原文 2016-02-11 22:14 1928 Java/ java

开发者都会用到Arrays.sort来对原生数组进行排序，这个API会使用归并排序或者Tim排序来进行排序，源码如下所示：

 
   public static void sort(Object[] a) {
  if (LegacyMergeSort.userRequested)
      legacyMergeSort(a);
  else
      ComparableTimSort.sort(a);
} 
  

上面的代码会依次执行，归并排序使用了分治的技术。

Java8出来之后，有一个新API用来进行排序，这就是Arrays.ParallelSort,这是一种并行排序，让我们来看看它是怎么实现的。

Arrays.ParallelSort使用了Java7的Fork/Join框架使排序任务可以在现场池中的多个线程中进行，Fork/Join实现了一种任务窃取算法，一个闲置的线程可以窃取其他线程的闲置任务进行处理。

Arrays.parallelSort概述

这个方法使用了一个临界值，还有一些容量小于这个临界值的数组，这个临界值和数组的容量都是计算来用于并行计算的，如下代码所示：

 
   private static final int getSplitThreshold(int n) {
  int p = ForkJoinPool.getCommonPoolParallelism();
  int t = (p > 1) ? (1 + n / (p << 3)) : n;
  return t < MIN_ARRAY_SORT_GRAN ? MIN_ARRAY_SORT_GRAN : t;
} 
  

一旦数组决定了使用并行排序，那他马上会被分为几个部分，然后通知Fork/Join任务对各个部分进行排序，跟着通知另外的Fork/Join任务对排序后的数组进行合并。

Java8使用如下的方法进行实现：

1、将数组分成4个子数组。

2、对前面两个子数组进行排序然后合并。

3、对后面的两个进行排序然后合并。

上面着几个步骤会重复递归，每个子数组都要求容量小于上面计算出来的临界值。

对比结果

我尝试去对比Arrays.sort和Arrays.parallelSort的排序时间，在一台4CPU的电脑上，使用如下的代码：

public class ArraysParallelDemo {
  public static void main(String[] args) throws FileNotFoundException {
    List<Double> arraySource = new ArrayList<>();
 
    Scanner reader = new Scanner(ClassLoader.
        getSystemResourceAsStream("java8demo/large_array_input"));
    while(reader.hasNext()){
      String line = reader.nextLine();
      String[] strNums = line.split(",");
      for ( String strN : strNums){
          arraySource.add(Double.parseDouble(strN));
      }
    }
 
    System.out.println(arraySource.size());
 
    Double [] myArray = new Double[1];
    myArray = arraySource.toArray(myArray);
    long startTime = System.currentTimeMillis();
    Arrays.sort(myArray);
    long endTime = System.currentTimeMillis();
    System.out.println("Time take in serial: "+
        (endTime-startTime)/1000.0);
 
    Double [] myArray2 = new Double[1];
    myArray2 = arraySource.toArray(myArray);
    startTime = System.currentTimeMillis();
    Arrays.parallelSort(myArray2);
    endTime = System.currentTimeMillis();
    System.out.println("Time take in parallel: "+
        (endTime-startTime)/1000.0);
 
  }
}

数组容量和时间消耗的一个基准测试如下所示：

在数组容量小于10000的情况下，并行排序和串行排序消耗时间是差不多的，但是当数组容量在10000以上的时候，并行排序就体现出了它的优势。

免责声明！

本站转载的文章为个人学习借鉴使用，本站对版权不负任何法律责任。如果侵犯了您的隐私权益，请联系本站邮箱yoyou2525@163.com删除。

猜您在找 Arrays.sort() VS Arrays.parallelSort() JAVA基础系列：Arrays.sort() Java的Arrays.sort()方法到底用的什么排序算法 Java8 Collections.sort()及Arrays.sort()中Lambda表达式及增强版Comparator的使用 Arrays.sort()原理 Java 使用Arrays.sort排序从大到小排列 Arrays.sort() 的一些用法学习日记1 Arrays.sort()源码解析 Arrays.sort()和lambda表达式-> java中用Arrays.sort实现多维数组的自定义排序