篇章十 数据结构——排序

发布于:2025-06-14 ⋅ 阅读:(24) ⋅ 点赞:(0)

排序

1.排序的概念及引用

1.1 排序的概念

排序:所谓排序,就是使一串记录,按照其中的某个或某些关键字的大小,递增或递减的排列起来的操作。

稳定性:假定在待排序的记录序列中,存在多个具有相同的关键字的记录,若经过排序,这些记录的相对次序保持不变,即在原序列中,r[i]=r[j],且r[i]在r[j]之前,而在排序后的序列中,r[i]仍在r[j]之前,则称这种排序算法是稳定的;否则称为不稳定的

内部排序:数据元素全部放在内存中的排序。

外部排序:数据元素太多不能同时放在内存中,根据排序过程的要求需要在内外存之间移动数据的排序。

1.2 排序运用

1.3 常见的排序算法

2.常见排序算法的实现

2.1 插入排序

2.1.1 基本思想:

直接插入排序是一种简单的插入排序法。

其基本思想是:把待排序的记录按其关键码值的大小逐个插入到一个已经排好序的有序序列中,直到所有的记录插入完为止,得到一个新的有序序列 。实际中我们玩扑克牌时,就用了插入排序的思想。

2.1.2 直接插入排序

直接插入排序图解及其时间复杂度:

当插入第i(i>=1)个元素时,前面的array[0],array[1],…,array[i-1]已经排好序,

此时用array[i]的排序码与array[i-1],array[i-2],…的排序码顺序进行比较,

找到插入位置即将array[i]插入,

原来位置上的元素顺序后移  

直接插入排序的特性总结:

  1. 元素集合越接近有序,直接插入排序算法的时间效率越高

  2. 时间复杂度:O(N^2)

  3. 空间复杂度:O(1),它是一种稳定的排序算法

  4. 稳定性:稳定

 /**
     * 直接插入排序
     *
     * 时间复杂度 O(N^2)
     *         最坏情况:逆序的 5 4 3 2 1
     *         最好情况:顺序的 1 2 3 4 5   O(n)
     *         如果数据越有序 直接插入排序越快
     * 空间复杂度 O(1)
     * 稳定性 稳定的排序
     *       本身如果是一个稳定的排序,那么可以实现为不稳定的
     *       但是如果一个排序 本身是不稳定的 不能实现为稳定的
     * @param array
     */
    public static void insertSort(int[] array) {
        for (int i = 1; i < array.length; i++) {
            int tmp = array[i];
            int j = i - 1;
            for (; j >= 0; j--) {
                if (array[j] > tmp) {
                    array[j + 1] = array[j];
                }else {
                    array[j + 1] = tmp;
                    break;
                }
            }
            array[j + 1] = tmp;
        }
    }

2.1.3 希尔排序( 缩小增量排序 )

希尔排序法又称缩小增量法。

希尔排序法的基本思想是:先选定一个整数,把待排序文件中所有记录分成多个组,所有距离为的记录分在同一组内,并对每一组内的记录进行排序。然后,取,重复上述分组和排序的工作。当到达=1时,所有记录在统一组内排好序。  

插入排序图示:

讨论每组插入排序的时候怎么排?(跳跃式排法)

希尔排序的特性总结:

  1. 希尔排序是对直接插入排序的优化

  2. 当gap > 1时都是预排序,目的是让数组更接近于有序。当gap == 1时,数组已经接近有序的了,这样就会很快。这样整体而言,可以达到优化的效果。我们实现后可以进行性能测试的对比。

  3. 希尔排序的时间复杂度不好计算,因为gap的取值方法很多,导致很难去计算,因此在好些书中给出的希尔排序的时间复杂度都不固定:  

  4. 不稳定

 

/**
     * 希尔排序
     * 不稳定的
     * 时间复杂度 n ^ 1.3 - n ^ 1.5
     * 空间复杂度 O(1)
     * @param array
     */
    public static void shellSort(int[] array) {
        int gap = array.length;
        while (gap > 1) {
            gap /= 2;
            shell(array, gap);
        }
    }

    private static void shell(int[] array, int gap) {
        for (int i = gap; i < array.length; i++) {
            int tmp = array[i];
            int j = i - gap;
            for (; j >= 0; j -= gap) {
                if (array[j] > tmp) {
                    array[j + gap] = array[j];
                }else {
                    array[j + gap] = tmp;
                    break;
                }
            }
            array[j + gap] = tmp;
        }
    }

2.2 选择排序

2.2.1基本思想:

每一次从待排序的数据元素中选出最小(或最大)的一个元素

存放在序列的起始位置,

直到全部待排序的数据元素排完 。

2.2.2 直接选择排序:

直接选择排序图示:

  • 在元素集合array[i]--array[n-1]中选择关键码最大(小)的数据元素

  • 若它不是这组元素中的最后一个(第一个)元素,则将它与这组元素中的最后一个(第一个)元素交换

  • 在剩余的array[i]--array[n-2](array[i+1]--array[n-1])集合中,重复上述步骤,直到集合剩余1个元素

 

【直接选择排序的特性总结】

  1. 直接选择排序思考非常好理解,但是效率不是很好。实际中很少使用

  2. 时间复杂度:O(N^2)

  3. 空间复杂度:O(1)

  4. 稳定性:不稳定

/**
     * 选择排序
     * 时间复杂度:O(n^2)
     *          和数据是否有序无关
     * 空间复杂度:O(1)
     * 稳定性:不稳定的排序
     * @param array
     */
    public static void selectSort(int[] array) {
        for (int i = 0; i < array.length; i++) {
            int minIndex = i;
            for (int j = i + 1; j < array.length; j++) {
                if(array[j] < array[minIndex]) {
                    minIndex = j;
                }
            }
            swap(array, i, minIndex);
        }
    }

    private static void swap(int[] array, int i, int j) {
        int tmp = array[i];
        array[i] = array[j];
        array[j] = tmp;
    }

优化:(左右开工)

 

/**
     * 选择排序优化
     */

    public static void selectSort1(int[] array) {
        int left = 0;
        int right = array.length - 1;
        while (left < right) {
            int minIndex = left;
            int maxIndex = left;
            for (int i = left + 1; i <= right ; i++) {
                if (array[i]  < array[minIndex]) {
                    minIndex = i;
                }
                if (array[i] > array[maxIndex]) {
                    maxIndex = i;
                }
            }
            swap(array, left, minIndex);
            // 最大值正好是left下标, 此时 把最大值换到了 minIndex的位置了
            if(maxIndex == left) {
                maxIndex = minIndex;
            }
            swap(array, right, maxIndex);
            left++;
            right--;
        }
    }

2.2.3 堆排序

堆排序(Heapsort)是指利用堆积树(堆)这种数据结构所设计的一种排序算法,

它是选择排序的一种。

它是通过堆来进行选择数据。

需要注意的是排升序要建大堆,排降序建小堆。

【堆排序的特性总结】

  1. 堆排序使用堆来选数,效率就高了很多。

  2. 时间复杂度:O(N*logN)

  3. 空间复杂度:O(1)

  4. 稳定性:不稳定

/**
     * 堆排序
     * 时间复杂度:O(n * logN)
     * 空间复杂度:O(1)
     * 稳定性:不稳定
     */
    public static void heapSort(int[] array) {
        createHeap(array);

        int end = array.length - 1;
        while (end > 0) {
            swap(array, 0 ,end);
            siftDown(array, 0, end);
            end--;
        }
    }

    private static void createHeap(int[] array) {
        for (int parent = (array.length - 1 - 1) / 2; parent >= 0; parent--) {
            siftDown(array, parent, array.length);
        }
    }

    /**
     *
     * @param array
     * @param parent 每颗子树调整的根节点
     * @param length 每颗子树调整的结束节点
     */
    private static void siftDown(int[] array, int parent, int length) {
        int child = 2 * parent + 1;
        while (child < length) {
            if (child + 1 < length && array[child] < array[child + 1]) {
                child++;
            }

            if (array[child] > array[parent]) {
                swap(array, child, parent);
                parent = child;
                child = parent * 2 + 1;
            }else {
                break;
            }
        }
    }

 

2.3 交换排序

基本思想:所谓交换,

就是根据序列中两个记录键值的比较结果对换这两个记录在序列中的位置

交换排序的特点是:将键值较大的记录向序列的尾部移动,键值较小的记录向序列的前部移动。

2.3.1冒泡排序

【冒泡排序的特性总结】

  1. 冒泡排序是一种非常容易理解的排序

  2. 时间复杂度:O(N^2)

  3. 空间复杂度:O(1)

  4. 稳定性:稳定

优化后: 

/**
     * 冒泡排序
     * 时间复杂度 [讨论 没有优化情况下 也就是 没有下方的boolean元素 和 -i 操作]
     *          O(N^2)
     *          优化以后 可能达到O(N)
     * 空间复杂度 O(1)
     * 稳定性 稳定的排序
     */
    public static void bubbleSort(int[] array) {
        for (int i = 0; i < array.length - 1; i++) {
            boolean flag = false;
            for (int j = 0; j < array.length - 1 - i; j++) {
                if(array[j] > array[j + 1]) {
                    swap(array, j, j + 1);
                    flag = true;
                }
            }
            if (!flag) {
                break;
            }
        }
    }

2.3.2 快速排序

快速排序是Hoare于1962年提出的一种二叉树结构的交换排序方法

其基本思想为:任取待排序元素序列中的某元素作为基准值,

按照该排序码将待排序集合分割成两子序列,左子序列中所有元素均小于基准值,右子序列中所有元素均大于基准值,

然后最左右子序列重复该过程,直到所有元素都排列在相应位置上为止。

// 假设按照升序对array数组中[left, right)区间中的元素进行排序
void QuickSort(int[] array, int left, int right)
{
   if(right - left <= 1)
       return;
   
   // 按照基准值对array数组的 [left, right)区间中的元素进行划分
   int div = partion(array, left, right);
   
   // 划分成功后以div为边界形成了左右两部分 [left, div) 和 [div+1, right)
   // 递归排[left, div)
   QuickSort(array, left, div);
   
   // 递归排[div+1, right)
   QuickSort(array, div+1, right);
}

上述为快速排序递归实现的主框架,发现与二叉树前序遍历规则非常像,

在写递归框架时可想想二叉树前序遍历规则即可快速写出来,

后序只需分析如何按照基准值来对区间中数据进行划分的方式即可。

将区间按照基准值划分为左右两半部分的常见方式有三种,最常用的是挖坑法:

1.挖坑法

private static int partition(int[] array, int left, int right) {
   int i = left;
   int j = right;
   int pivot = array[left];
   while (i < j) {
       while (i < j && array[j] >= pivot) {
           j--;
      }
       
       array[i] = array[j];
       
       while (i < j && array[i] <= pivot) {
           i++;
      }
       
       array[j] = array[i];
  }
   array[i] = pivot;
   return i;
}
2.Hoare版

示意图:

时间复杂度:

 

问题:

 

private static int partition(int[] array, int left, int right) {
   int i = left;
   int j = right;
   int pivot = array[left];
   while (i < j) {
       while (i < j && array[j] >= pivot) {
           j--;
      }
       
       while (i < j && array[i] <= pivot) {
           i++;
      }
       
       swap(array, i, j);
  }
   swap(array, i, left);
   return i;
}
 3.前后指针

private static int partition(int[] array, int left, int right) {
   int prev = left ;
   int cur = left+1;
   while (cur <= right) {
       if(array[cur] < array[left] && array[++prev] != array[cur]) {
           swap(array,cur,prev);
      }
       cur++;
  }
   swap(array,prev,left);
   return prev;
}

2.3.3 快速排序优化

思路:

1.三数取中法选key

/**
     * 时间复杂度
     *      当数据给定的是 1 2 3 4 5 6 7  ...... 有序的情况下 确实是O(N^2)
     *      最好情况:O(N * logN)
     *
     * 空间复杂度
     *          最坏情况 O(N)
     *          最好情况 O(logN)
     * 稳定性
     *      不稳定性
     * @param array
     */
    public static void quickSort(int[] array) {
        quick(array, 0 , array.length - 1);
    }

    private static void quick(int[] array, int start, int end) {
        if(start >= end) {
            return;
        }

        int midIndex = getMiddleNum(array, start, end);
        swap(array, start, midIndex);

        int pivot = partition1(array, start, end);

        quick(array, start, pivot - 1);
        quick(array, pivot + 1, end);
    }
    
    // 挖坑法
    private static int partition1(int[] array, int left, int right) {
        int tmp = array[left];

        while (left < right) {
            while (left < right && array[right] >= tmp) {
                right--;
            }

            array[left] = array[right];

            while (left < right && array[left] <= tmp) {
                left++;
            }

            array[right] = array[left];
        }
        array[left] = tmp;
        return left;
    }
 2.递归到小的子区间时,可以考虑使用插入排序
/**
     * 时间复杂度
     *      当数据给定的是 1 2 3 4 5 6 7  ...... 有序的情况下 确实是O(N^2)
     *      最好情况:O(N * logN)
     *
     * 空间复杂度
     *          最坏情况 O(N)
     *          最好情况 O(logN)
     * 稳定性
     *      不稳定性
     * @param array
     */
    public static void quickSort(int[] array) {
        quick(array, 0 , array.length - 1);
    }

    private static void quick(int[] array, int start, int end) {
        if(start >= end) {
            return;
        }
        if (end - start + 1 <= 10) {
            insertSortRange(array, start, end);
            return;
        }

        int midIndex = getMiddleNum(array, start, end);
        swap(array, start, midIndex);

        int pivot = partition1(array, start, end);

        quick(array, start, pivot - 1);
        quick(array, pivot + 1, end);
    }

    private static void insertSortRange(int[] array, int start, int end) {
        for (int i = start + 1; i <= end; i++) {
            int tmp = array[i];
            int j = i - 1;
            for (; j >= start; j--) {
                if (array[j] > tmp) {
                    array[j + 1] = array[j];
                }else {
                    array[j + 1] = tmp;
                    break;
                }
            }
            array[j + 1] = tmp;
        }
    }
    // 挖坑法
    private static int partition1(int[] array, int left, int right) {
        int tmp = array[left];

        while (left < right) {
            while (left < right && array[right] >= tmp) {
                right--;
            }

            array[left] = array[right];

            while (left < right && array[left] <= tmp) {
                left++;
            }

            array[right] = array[left];
        }
        array[left] = tmp;
        return left;
    }

2.3.4 快速排序非递归

 

void quickSortNonR(int[] a, int left, int right) {
   Stack<Integer> st = new Stack<>();
   st.push(left);
   st.push(right);
   while (!st.empty()) {
       right = st.pop();
       left = st.pop();
       if(right - left <= 1)
           continue;
       int div = PartSort1(a, left, right);
       // 以基准值为分割点,形成左右两部分:[left, div) 和 [div+1, right)
       st.push(div+1);
       st.push(right);
       
       st.push(left);
       st.push(div);
  }
}

2.3.5 快速排序总结

  1. 快速排序整体的综合性能和使用场景都是比较好的,所以才敢叫快速排序

  2. 时间复杂度:O(N*logN)

  3. 空间复杂度:O(logN)

  4. 稳定性:不稳定

2.4 归并排序

2.4.1 基本思想

归并排序(MERGE-SORT)是建立在归并操作上的一种有效的排序算法,

该算法是采用分治法(Divide andConquer)的一个非常典型的应用。

将已有序的子序列合并,得到完全有序的序列;

即先使每个子序列有序,再使子序列段间有序。

若将两个有序表合并成一个有序表,称为二路归并。

归并排序核心步骤:

 /**
     * 归并排序
     * 时间复杂度:O(N * logN)
     * 空间复杂度:O(N)
     * 稳定性:稳定   
     * @param array
     */
    public static void mergeSort(int[] array) {
        mergeSortTmp(array, 0, array.length - 1);
    }

    public static void mergeSortTmp(int[] array, int left, int right) {
        if(left >= right) {
            return;
        }

        int mid = (left + right) / 2;
        mergeSortTmp(array, left, mid);
        mergeSortTmp(array, mid + 1, right);
        // 分解完毕
        // 开始合并
        merge(array, left, mid, right);
    }

    private static void merge(int[] array, int left, int mid, int right) {
        int[] tmp = new int[right - left + 1];
        int k = 0;
        int s1 = left;
        int e1 = mid;
        int s2 = mid + 1;
        int e2 = right;

        while (s1 <= e1 && s2 <= e2) {
            if (array[s1] <= array[s2]) {
                tmp[k++] = array[s1++];
            }else {
                tmp[k++] = array[s2++];
            }
        }

        while (s1 <= e1) {
            tmp[k++] = array[s1++];
        }

        while (s2 <= e2) {
            tmp[k++] = array[s2++];
        }

        // 可以保证tmp数组 是有序的
        for(int i = 0; i < k; i++) {
            array[i + left] = tmp[i];
        }
    }

 

2.4.2 归并排序总结

  1. 归并的缺点在于需要O(N)的空间复杂度,归并排序的思考更多的是解决在磁盘中的外排序问题。

  2. 时间复杂度:O(N*logN)

  3. 空间复杂度:O(N)

  4. 稳定性:稳定

2.4.3 海量数据的排序问题

外部排序:排序过程需要在磁盘等外部存储进行的排序前提:内存只有 1G,需要排序的数据有 100G因为内存中因为无法把所有数据全部放下,所以需要外部排序,而归并排序是最常用的外部排序

  1. 先把文件切分成 200 份,每个 512 M

  2. 分别对 512 M 排序,因为内存已经可以放的下,所以任意排序方式都可以

  3. 进行 2路归并,同时对 200 份有序文件做归并过程,最终结果就有序了 

2.4.4 非递归写法

public static void mergeSortNor(int[] array) {
        int gap = 1;
        while (gap < array.length) {
            for (int i = 0; i < array.length; i = i + gap * 2) {
                int left = i;
                int mid = left + gap - 1;
                if (mid >= array.length) {
                    mid = array.length - 1;
                }
                int right = mid + gap;
                if (right >= array.length) {
                    right = array.length - 1;
                }
                merge(array, left, mid, right);
            }
            gap *= 2;
        }
    }

3. 排序算法复杂度及稳定性分析

 

4.其他非基于比较排序(了解)

 

1.计数排序

思想:计数排序又称为鸽巢原理,是对哈希直接定址法的变形应用。 操作步骤:

  1. 统计相同元素出现次数

  2. 根据统计的结果将序列回收到原来的序列中

 

【计数排序的特性总结】

  1. 计数排序在数据范围集中时,效率很高,但是适用范围及场景有限。

  2. 时间复杂度:O(范围 + N)

  3. 空间复杂度:O(范围)

  4. 稳定性:稳定

 

2.基数排序

3.桶排序

5. 选择题

1. 快速排序算法是基于()的一个排序算法。
  A:分治法 √      B:贪心法     C:递归法       D:动态规划法
2.对记录(54,38,96,23,15,72,60,45,83)进行从小到大的直接插入排序时,当把第8个记录45插入到有序表时,为找到插入
位置需比较()次?(采用从后往前比较)
  A: 3           B: 4         C: 5     √      D: 6
3.以下排序方式中占用O(n)辅助存储空间的是()
  A: 简单排序     B: 快速排序   C: 堆排序       D: 归并排序 √
4.下列排序算法中稳定且时间复杂度为O(n^2)的是()
  A: 快速排序     B: 冒泡排序  √ C: 直接选择排序 D: 归并排序
5.关于排序,下面说法不正确的是()
  A: 快排时间复杂度为O(N*logN),空间复杂度为O(logN)
  B: 归并排序是一种稳定的排序,堆排序和快排均不稳定
  C: 序列基本有序时,快排退化成 "冒泡排序",直接插入排序最快
  D: 归并排序空间复杂度为O(N), 堆排序空间复杂度的为O(logN)  √
6.设一组初始记录关键字序列为(65,56,72,99,86,25,34,66),则以第一个关键字65为基准而得到的一趟快速排序结果是()
  A: 34,56,25,65,86,99,72,66      √       B: 25,34,56,65,99,86,72,66
  C: 34,56,25,65,66,99,86,72             D: 34,56,25,65,99,86,72,66
 
 
【参考答案】
1.A   2.C   3.D   4.B   5.D   6.A