希尔排序是冲破二次时间屏障 的第一批算法之一,实现过程是是通过比较相隔较远距离(称为增量)的数,使得数移动时能跨过多个元素,则进行一次比较就可能消除多个元素交换。那些增量组成的序列就成为增量序列,不同的增量序列会对希尔排序的时间复杂度产生影响,在根本上希尔排序是属于插入类排序。
图示:
C语言代码:
void shellsort(ElemType A[], int N) { int i, j, Increment; ElemType Tmp; for (Increment = N / 2; Increment > 0; Increment /= 2) for (i = Increment; i < N; i++) { Tmp = A[i]; for (j = i; j >= Increment; j -= Increment) if (Tmp < A[j - Increment]) A[j] = A[j - Increment]; else break; A[j] = Tmp; } }
在希尔排序中希尔给出了一组增量序列:ht = N / 2, h[k+1] = h[k] / 2,即{N/2, (N / 2)/2, ..., 1},这个序列就叫做希尔增量。这个是编写希尔排序时最常用的序列,但却不是最好的,使用希尔增量时希尔排序的最坏情形运行时间为O(N2)。其余的增量序列还有Hibbard:{1, 3, ..., 2^k-1},使用Hibbard增量时希尔排序的最坏情形运行时间为O(N3/2),这个界适用于广泛的增量序列。还有更好的序列Sedgewick:{1, 5, 19, 41, 109...}该序列中的项或者是9*4^i - 9*2^i + 1或者是4^i - 3*2^i + 1,这种增量最坏的复杂度为O(N4/3),平均复杂度为O(N7/6),但也没有被完全证明。
希尔排序的性能在事件中是完全可以接受的,而且编程简单,是对较大的输入数据经常使用的算法。
(文章摘录《数据结构与算法分析C语言描述》机械工业出版社)