堆排序

堆(Heap)：(维基百科)

堆通常是一个可以被看做一棵树的数组对象。在队列中，调度程序反复提取队列中第一个作业并运行，因为实际情况中某些时间较短的任务将等待很长时间才能结束，或者某些不短小，但具有重要性的作业，同样应当具有优先权。堆即为解决此类问题设计的一种数据结构。

堆的实现通过构造二叉堆（binary heap），实为二叉树的一种；由于其应用的普遍性，当不加限定时，均指该数据结构的这种实现。

二叉堆需要满足的性质：

1、堆上任何一个节点都不大于它的父亲节点（最大堆）

2、堆是一颗完全的二叉树(即除了最底层，其他层的节点都被元素填满，且最底层尽可能地从左到右填入)

对于堆中的任何节点i：

其父节点索引为parent(i) = i/2
其左孩子节点索引为left child (i) = 2 * i
其又孩子节点索引为right child (i) = 2 * i + 1

最大堆的数据结构

public class MaxHeap<Item> {
    private Item[] data;
    private int count;

    public MaxHeap(int capacity) {
        data = (Item[]) new Object[capacity];
        count = 0;
    }

    public int size() {
        return count;
    }

    public boolean isEmpty() {
        return count == 0;
    }
}

Shift Up

插入一个节点，需要维护二叉堆的性质：

public class MaxHeap<Item extends Comparable> {
    private Item[] data;
    private int count;
    private int capacity;

    public MaxHeap(int capacity) {
        data = (Item[])new Comparable[capacity + 1];
        count = 0;
        this.capacity = capacity;
    }

    public int size() {
        return count;
    }

    public boolean isEmpty() {
        return count == 0;
    }

    public void insert(Item item) {
        assert (count < capacity);
        data[count + 1] = item;
        count++;
        shiftUp(count);
    }

    private void shiftUp(int k) {
        while (k > 1 && data[k].compareTo(data[k / 2]) < 0) {
            swap(data, k, k / 2);
            k /= 2;
        }
    }

    private void swap(Item[] data, int k, int i) {
        Item temp = data[k];
        data[k] = data[i];
        data[i] = temp;
    }
}

ShiftDown

// 从最大堆中取出堆顶元素, 即堆中所存储的最大数据
public Item extractMax() {
    assert count > 0;
    Item ret = data[1];
    swap(1, count);
    count--;
    shiftDown(1);
    return ret;
}

private void shiftDown(int k) {
    while ( 2 * k <= count) { // 如果有左孩子
        int j = 2 * k;  // 在此轮循环中,data[k]和data[j]交换位置
        if (j+1 <= count && data[j].compareTo(data[j + 1]) < 0) {
            j++; // data[j] 是 data[2*k]和data[2*k+1]中的最大值
        }
        if (data[k].compareTo(data[j]) >= 0) {
            break;
        }
        swap(k,j);
        k = j;
    }
}

Heapify

构造函数, 通过一个给定数组创建一个最大堆

// 该构造堆的过程, 时间复杂度为O(n)
public MaxHeap(Item[] arr) {
    int n = arr.length;
    data = (Item[]) new Comparable[n + 1];
    for (int i = 0; i < n; i++) {
        data[i + 1] = arr[i];
    }
    count = n;
    for (int i = count / 2; i >= 1; i--) {
        shiftDown(i);
    }
}

Heapify的算法复杂度

将n个元素逐个插入到一个空堆中，算法复杂度是O(nlogn) heapify的过程，算法复杂度为O(n)

堆排序实现1

对整个arr数组使用HeapSort1排序,HeapSort1, 将所有的元素依次添加到堆中, 在将所有元素从堆中依次取出来, 即完成了排序,无论是创建堆的过程, 还是从堆中依次取出元素的过程, 时间复杂度均为O(nlogn),整个堆排序的整体时间复杂度为O(nlogn)

public static void sort(Comparable[] arr){

    int n = arr.length;
    MaxHeap<Comparable> maxHeap = new MaxHeap<Comparable>(n);
    for( int i = 0 ; i < n ; i ++ )
        maxHeap.insert(arr[i]);

    for( int i = n-1 ; i >= 0 ; i -- )
        arr[i] = maxHeap.extractMax();
}

堆排序实现2

对整个arr数组使用HeapSort2排序,HeapSort2,借助我们的heapify过程创建堆,此时, 创建堆的过程时间复杂度为O(n), 将所有元素依次从堆中取出来, 实践复杂度为O(nlogn),堆排序的总体时间复杂度依然是O(nlogn), 但是比HeapSort1性能更优, 因为创建堆的性能更优

public static void sort(Comparable[] arr){
    int n = arr.length;
    MaxHeap<Comparable> maxHeap = new MaxHeap<Comparable>(arr);
    for( int i = n-1 ; i >= 0 ; i -- )
        arr[i] = maxHeap.extractMax();
}

原地堆排序

将最左边的max不断的移动到最右边

如果最大堆从索引0开始排序：

索引堆(Index Heap)

最大索引堆的实现

package bobo.algo;

import java.util.*;
import java.lang.*;

// 最大索引堆
public class IndexMaxHeap<Item extends Comparable> {

    protected Item[] data;      // 最大索引堆中的数据
    protected int[] indexes;    // 最大索引堆中的索引
    protected int count;
    protected int capacity;

    // 构造函数, 构造一个空堆, 可容纳capacity个元素
    public IndexMaxHeap(int capacity){
        data = (Item[])new Comparable[capacity+1];
        indexes = new int[capacity+1];
        count = 0;
        this.capacity = capacity;
    }

    // 返回索引堆中的元素个数
    public int size(){
        return count;
    }

    // 返回一个布尔值, 表示索引堆中是否为空
    public boolean isEmpty(){
        return count == 0;
    }

    // 向最大索引堆中插入一个新的元素, 新元素的索引为i, 元素为item
    // 传入的i对用户而言,是从0索引的
    public void insert(int i, Item item){

        assert count + 1 <= capacity;
        assert i + 1 >= 1 && i + 1 <= capacity;

        i += 1;
        data[i] = item;
        indexes[count+1] = i;
        count ++;

        shiftUp(count);
    }

    // 从最大索引堆中取出堆顶元素, 即索引堆中所存储的最大数据
    public Item extractMax(){
        assert count > 0;

        Item ret = data[indexes[1]];
        swapIndexes( 1 , count );
        count --;
        shiftDown(1);

        return ret;
    }

    // 从最大索引堆中取出堆顶元素的索引
    public int extractMaxIndex(){
        assert count > 0;

        int ret = indexes[1] - 1;
        swapIndexes( 1 , count );
        count --;
        shiftDown(1);

        return ret;
    }

    // 获取最大索引堆中的堆顶元素
    public Item getMax(){
        assert count > 0;
        return data[indexes[1]];
    }

    // 获取最大索引堆中的堆顶元素的索引
    public int getMaxIndex(){
        assert count > 0;
        return indexes[1]-1;
    }

    // 获取最大索引堆中索引为i的元素
    public Item getItem( int i ){
        assert i + 1 >= 1 && i + 1 <= capacity;
        return data[i+1];
    }

    // 将最大索引堆中索引为i的元素修改为newItem
    public void change( int i , Item newItem ){

        i += 1;
        data[i] = newItem;

        // 找到indexes[j] = i, j表示data[i]在堆中的位置
        // 之后shiftUp(j), 再shiftDown(j)
        for( int j = 1 ; j <= count ; j ++ )
            if( indexes[j] == i ){
                shiftUp(j);
                shiftDown(j);
                return;
            }
    }

    // 交换索引堆中的索引i和j
    private void swapIndexes(int i, int j){
        int t = indexes[i];
        indexes[i] = indexes[j];
        indexes[j] = t;
    }

    //********************
    //* 最大索引堆核心辅助函数
    //********************

    // 索引堆中, 数据之间的比较根据data的大小进行比较, 但实际操作的是索引
    private void shiftUp(int k){

        while( k > 1 && data[indexes[k/2]].compareTo(data[indexes[k]]) < 0 ){
            swapIndexes(k, k/2);
            k /= 2;
        }
    }

    // 索引堆中, 数据之间的比较根据data的大小进行比较, 但实际操作的是索引
    private void shiftDown(int k){

        while( 2*k <= count ){
            int j = 2*k;
            if( j+1 <= count && data[indexes[j+1]].compareTo(data[indexes[j]]) > 0 )
                j ++;

            if( data[indexes[k]].compareTo(data[indexes[j]]) >= 0 )
                break;

            swapIndexes(k, j);
            k = j;
        }
    }

    // 测试索引堆中的索引数组index
    // 注意:这个测试在向堆中插入元素以后, 不进行extract操作有效
    public boolean testIndexes(){

        int[] copyIndexes = new int[count+1];

        for( int i = 0 ; i <= count ; i ++ )
            copyIndexes[i] = indexes[i];

        copyIndexes[0] = 0;
        Arrays.sort(copyIndexes);

        // 在对索引堆中的索引进行排序后, 应该正好是1...count这count个索引
        boolean res = true;
        for( int i = 1 ; i <= count ; i ++ )
            if( copyIndexes[i-1] + 1 != copyIndexes[i] ){
                res = false;
                break;
            }

        if( !res ){
            System.out.println("Error!");
            return false;
        }

        return true;
    }

    // 测试 IndexMaxHeap
    public static void main(String[] args) {

        int N = 1000000;
        IndexMaxHeap<Integer> indexMaxHeap = new IndexMaxHeap<Integer>(N);
        for( int i = 0 ; i < N ; i ++ )
            indexMaxHeap.insert( i , (int)(Math.random()*N) );
        assert indexMaxHeap.testIndexes();
    }
}

上面的代码change的复杂度O(n)还可以优化：

堆排序

堆排序