Java 【数据结构】常见排序算法实用详解(下) 冒泡排序/快速排序/归并排序/非基于比较排序【贤者的庇护】

发布于:2024-05-05 ⋅ 阅读:(28) ⋅ 点赞:(0)

 登神长阶

上古神器-常见排序算法

冒泡排序/快速排序/归并排序/非基于比较排序


💰一.前言

        为保障知识获取的可读性,以及连贯性,再开始可以适当的重新温习前文内容 :Java 【数据结构】常见排序算法实用详解(上) 插入排序/希尔排序/选择排序/堆排序【贤者的庇护】

        在本篇内容我们将紧跟前篇内容,进一步学习冒泡排序,快速排序,归并排序以及非基于比较排序。 

🪙二.冒泡排序

基本原理

冒泡排序是一种简单直观的排序算法,它重复地遍历要排序的列表,一次比较两个元素,并且如果它们的顺序错误就将它们交换位置。这个过程持续到列表没有任何再次交换的元素为止。

算法步骤

  1. 从列表的第一个元素开始,依次比较相邻的两个元素。
  2. 如果顺序不正确(例如,前面的元素大于后面的元素),则交换这两个元素。
  3. 继续对每一对相邻元素进行相同的操作,直到到达列表的末尾。
  4. 重复以上步骤,每次都从列表的开始处进行,直到没有任何元素需要交换。

时间复杂度

冒泡排序的时间复杂度为O(n^2),其中n是列表的长度。这是因为在最坏情况下,需要进行n-1轮比较,每一轮最多进行n-1次交换。

稳定性

冒泡排序是稳定的排序算法。在排序过程中,相同元素的相对位置不会发生变化,只有在相邻元素大小不同时才进行交换。

适用性

冒泡排序是一个简单但效率较低的排序算法,通常用于教学目的或者在数据集较小时。由于其时间复杂度较高,在大型数据集上性能不佳,不适合实际应用。然而,由于其实现简单,易于理解和实现,有时在一些特殊场景下可能会被采用。

源代码

 /**
     * 冒泡排序
     * 时间复杂度:
     * 不管数据 有序 还是无序 在不优化的情况下:O(N^2) 5 4 3 2 1
     * 空间复杂度:O(1)
     * 稳定性:稳定
     * 目前学到现在为止:2个稳定排序 ,插入排序 冒泡排序
     * @param arr
     */
    public static void bubbleSort(int[] arr){
        for (int i = 0; i < arr.length-1; i++) {
            boolean flag=false;
            for (int j = 0; j < arr.length-i-1; j++) {
                if (arr[j]>arr[j+1]){
                    swap(arr,j,j+1);
                    flag=true;
                }
            }
            //在优化了的情况下,当数据有序,1 2 3 4 5
            //时间复杂度为:O(N)
            if (flag==false){
                break;
            }
        }
    }

💴三.快速排序

基本原理

快速排序是一种基于分治思想的排序算法。它的基本思想是选择一个基准元素,然后将数组分割成两个子数组,一个子数组中的所有元素都比基准元素小,另一个子数组中的所有元素都比基准元素大。然后递归地对这两个子数组进行排序。

算法步骤

  1. 选择一个基准元素(通常是数组中的第一个元素)。
  2. 将数组分割成两个子数组,一个子数组中的元素都比基准元素小,另一个子数组中的元素都比基准元素大。
  3. 递归地对两个子数组进行排序。
  4. 将两个排序好的子数组合并起来。

时间复杂度

快速排序的平均时间复杂度为O(n log n),其中n是数组的长度。最坏情况下的时间复杂度是O(n^2),当数组已经有序或者基准元素选择不当时会发生。然而,由于快速排序通常表现良好,因此平均时间复杂度更具代表性。

稳定性

快速排序是不稳定的排序算法。在排序过程中,相同元素的相对位置可能会发生变化。

适用性

快速排序在大多数情况下表现良好,并且通常被认为是最快的排序算法之一(因此得名)。它特别适用于大型数据集的排序,因为其平均时间复杂度相对较低。然而,由于其不稳定性和最坏情况下的性能可能较差,有时可能不适用于特定情况,例如需要稳定排序的场景。

源代码 

 

 /**
     * 快速排序
     * 时间复杂度:O(N*logN)
     * 空间复杂度:O(logN)
     * 稳定性:不稳定
     * @param array
     */
public static void quickSort(int arr[]){//保证接口的统一性
        quick(arr,0,arr.length-1);
    }

    public static void quick(int[] arr,int start,int end){
        if (start>=end){
            return;
        }

        //寻找基准元素
        int par=partition(arr,start,end);

        quick(arr,start,par-1);
        quick(arr,par+1,end);
    }

 在上述代码之中, int par=partition(arr,start,end);有多种方法,在这里我们展开说明三种:

1.挖坑法

/**
     * 挖坑法
     * @param arr
     * @param left
     * @param right
     * @return
     */
    public static int partitionDig(int[] arr,int left,int right){
        int temp=arr[left];
        while(left<right){
            while(left<right&&arr[right]>=temp){
                right--;
            }
            arr[left]=arr[right];
            while(left<right&&arr[left]<=temp){
                left++;
            }
            arr[right]=arr[left];
        }
        arr[left]=temp;
        return left;
    }

2.Hoare法

 /**
     * Hoare法
     * @param arr
     * @param left
     * @param right
     * @return
     */
    public static int partitionHoare(int[] arr,int left,int right){
        int i=left;
        int temp=arr[left];
        while(left<right){
            while(left<right&&arr[right]>=temp){
                right--;
            }
            while(left<right&&arr[left]<=temp){
                left++;
            }
            swap(arr,left,right);
        }
        swap(arr,left,i);
        return left;
    }

3.前后指针法 

/**
     * 前后指针法
     * @param arr
     * @param left
     * @param right
     * @return
     */
    public static int partitionPrev(int[] arr,int left,int right){
        int prev=left;
        int cur=left+1;
        while(cur<=right){
            if (arr[cur]<arr[left]&&arr[++prev]!=arr[cur]){
                swap(arr,cur,prev);
            }
        }
        swap(arr,left,prev);
        return prev;
    }

同时由于当数据很少,且基本趋于有序的情况而言,我们对此代码进行优化

  /**
     * 快速排序 优化
     * 时间复杂度:O(N*logN)
     * 空间复杂度:O(logN)
     * 稳定性:不稳定
     * @param array
     */
    public static void quickSort(int arr[]){
        quick(arr,0,arr.length-1);
    }

    public static void quick(int[] arr,int start,int end){
        if (start>=end){
            return;
        }

        //优化
        if(end - start + 1 <= 10) {
            //插入排序
            insertSortRange(arr,start,end);
            return;
        }
        
        //三数取中
        int index = midThreeNum(arr,start,end);
        swap(arr,index,start);

        //寻找基准元素
        int par=partitionPrev(arr,start,end);

        quick(arr,start,par-1);
        quick(arr,par+1,end);
    }

    public static void insertSortRange(int[] arr,int left,int right){
        for (int i = left+1; i <= right; i++) {
            int temp=arr[i];
            int j=i-1;
            for (; j >=left ; j--) {
                if (arr[j]>temp){
                    arr[j+1]=arr[j];
                }else{
                    break;
                }
            }
            arr[j+1]=temp;
        }
    }

    /**
     * 三位取中
     * @param arr
     * @param left
     * @param right
     * @return
     */
    public static int midThreeNum(int[] arr,int left,int right){
        int mid=(left+right)/2;
        if (arr[left]<arr[right]){
            if (arr[mid]<arr[left]){
                return left;
            }else if(arr[mid]>arr[right]){
                return right;
            }else{
                return mid;
            }
        }else{
            if (arr[mid]<arr[right]){
                return right;
            }else if(arr[mid]>arr[left]){
                return left;
            }else{
                return mid;
            }
        }
    }

同时,我们也可以用非递归的方式去实现快速排序

 /**
     * 非递归实现快速排序
     * @param arr
     */
    public static void quickSortnot(int[] arr){
        Stack<Integer> stack=new Stack<>();
        int left=0;
        int right=arr.length-1;
        int par=partitionHoare(arr,left,right);
        if (par>left+1){
            stack.push(left);
            stack.push(par-1);
        }
        if (par<right-1){
            stack.push(par+1);
            stack.push(right);
        }
        while (!stack.empty()){
            right=stack.pop();
            left=stack.pop();
            par=partitionHoare(arr,left,right);
            if (par>left+1){
                stack.push(left);
                stack.push(par-1);
            }
            if (par<right-1){
                stack.push(par+1);
                stack.push(right);
            }
        }
    }
快速排序整体的综合性能和使用场景都是比较好的,所以才敢叫 快速 排序

💵四.归并排序

基本原理

归并排序是一种基于分治思想的排序算法。它的基本原理是将待排序的数组分成两部分,分别对这两部分进行排序,然后将排好序的子数组合并成一个大的有序数组。

算法步骤

  1. 分解:将待排序的数组递归地分成两个子数组,直到每个子数组只有一个元素。
  2. 合并:将相邻的两个子数组合并成一个有序的数组,直到整个数组被合并成一个有序的数组。

时间复杂度

归并排序的时间复杂度为O(n log n),其中n是数组的长度。这是因为归并排序的每一层递归都需要O(n)的时间来合并两个子数组,而递归的深度是O(log n)。因此总的时间复杂度是O(n log n)。

稳定性

归并排序是稳定的排序算法。在合并过程中,相同元素的相对位置不会发生变化,只有在不同子数组之间的合并时才会涉及元素交换。

适用性

归并排序适用于各种数据规模的排序,尤其在内存充足的情况下,其性能稳定且良好。由于其稳定性和较好的时间复杂度,归并排序常被用于外部排序,例如对大型文件进行排序。然而,由于其需要额外的空间来存储临时数组,因此在空间复杂度较为敏感的场景下可能不适用。

源代码

/**
     * 归并排序
     * 时间复杂度:0(N * logN)
     * 空间复杂度:O(N)
     * 稳定性:稳定的排序
     * @param arr
     */
    public static void mergeSort(int[] arr){
        mergeSortfun(arr,0,arr.length-1);
    }

    public static void mergeSortfun(int[] arr,int left,int right){
        if (left>=right){
            return;
        }
        int mid=(left+right)/2;

        mergeSortfun(arr,left,mid);
        mergeSortfun(arr,mid+1,right);

        //合并
        merge(arr,left,right,mid);
    }

    public static void merge(int[] arr,int left,int right,int mid){
        int s1=left;
        int e1=mid;
        int s2=mid+1;
        int e2=right;
        int k=0;
        int[] temp=new int[right-left+1];

        //要考虑相等
        while(s1<=e1&&s2<=e2){
            if (arr[s1]>arr[s2]){
                temp[k++]=arr[s2++];
            }else{
                temp[k++]=arr[s1++];
            }
        }

        while(s1<=e1){
            temp[k++]=arr[s1++];
        }

        while(s2<=e2){
            temp[k++]=arr[s2++];
        }
        //至此,temp数组中的所有元素已然有序
        //接下来把tmp数组的内容 拷贝到array数组当中

        //最后k=temp.length
        for (int i = 0; i < k; i++) {
            arr[i+left]=temp[i];
        }
    }

同理可得,可用非递归的方式去实现归并排序:

 public static void mergeSortnor(int[] arr){
        int gap=1;
        while(gap< arr.length){
            for (int i = 0; i < arr.length; i=i+gap*2) {
                int left=i;
                int mid=left+gap-1;
                if (mid>=arr.length){
                    mid=arr.length-1;
                }
                int right=mid+gap;
                if (right>=arr.length){
                    right=arr.length-1;
                }
                merge(arr,left,right,mid);
            }
            gap*=2;
        }
    }

💶五.常用排序算法复杂度及稳定性分析

我们可以对上述接触到的排序算法进行一个简单的分类

排序方法
最好
平均
最坏
空间复杂度
稳定性
冒泡排序
O(n)
O(n^2)
O(n^2)
O(1)
稳定
插入排序
O(n)
O(n^2)
O(n^2)
O(1)
稳定
选择排序
O(n^2)
O(n^2)
O(n^2)
O(1)
不稳定
希尔排序
O(n)
O(n^1.3)
O(n^2)
O(1)
不稳定
堆排序
O(n * log(n))
O(n * log(n))
O(n * log(n))
O(1)
不稳定
快速排序
O(n * log(n))
O(n * log(n))
O(n^2)
O(log(n)) ~ O(n)
不稳定
归并排序
O(n * log(n))
O(n * log(n))
O(n * log(n))
O(n)
稳定

        在时间复杂度方面,快速排序、堆排序和归并排序是最快的,它们的时间复杂度都是         O(n log n),适用于大多数场景。而插入排序、希尔排序、选择排序和冒泡排序的时间复杂度都在O(n^2)级别,适用于小规模数据或者教学目的。

        在稳定性方面,插入排序、归并排序和冒泡排序是稳定的排序算法,而希尔排序、选择排序、堆排序和快速排序是不稳定的排序算法。稳定性表示相同元素的相对位置是否在排序前后保持不变。

        在空间复杂度方面,除了归并排序需要额外的O(n)空间来存储临时数组外,其他排序算法的空间复杂度都是常数级别的,即O(1)。

💷 六.其他非基于比较排序(了解)

💷1.计数排序

基本原理

计数排序是一种非比较性的排序算法,其基本原理是统计待排序序列中每个元素的出现次数,然后根据元素的值将其放置到正确的位置上。计数排序假设待排序的元素都是整数,并且范围在一个已知的区间内。

算法步骤

  1. 统计计数: 遍历待排序的数组,统计每个元素出现的次数,并将统计结果存储在一个辅助数组中。
  2. 累加计数: 将统计数组中的元素累加,得到每个元素在排序后的数组中的位置。
  3. 排序: 遍历待排序的数组,根据统计数组中每个元素的值,将元素放置到排序后的数组中相应的位置上。
  4. 输出: 将排序后的数组输出作为排序结果。

时间复杂度

计数排序的时间复杂度为O(n + k),其中n是待排序数组的长度,k是待排序数组中元素的取值范围。在最坏情况下,即元素都是相同的,也需要进行n次遍历,因此时间复杂度为O(n)。而在元素范围较大的情况下,k会对时间复杂度产生影响,但通常情况下k远小于n,所以计数排序的时间复杂度可以近似看作是线性的。

稳定性

计数排序是稳定的排序算法。在排序过程中,相同元素的相对位置不会发生变化,只有根据元素的值进行元素的移动。

适用性

计数排序适用于元素取值范围较小,且待排序数组长度较大的情况。由于计数排序不涉及元素之间的比较,因此在某些情况下,它比基于比较的排序算法效率更高。然而,需要注意的是,计数排序需要额外的空间来存储统计数组,因此在元素范围非常大的情况下可能会占用过多内存。

源代码

 /**
     * 计数排序
     * 时间复杂度:O(N+范围)
     * 空间复杂度:O(范围)
     * 稳定性:稳定
     * @param array
     */
    public static void countSort(int[] array) {
        //1. 遍历数组 求最大值 和 最小值
        int maxVal = array[0];
        int minVal = array[0];
        for (int i = 0; i < array.length; i++) {
            if(maxVal < array[i]) {
                maxVal = array[i];
            }
            if(minVal > array[i]) {
                minVal = array[i];
            }
        }

        //2. 定义count数组
        int[] count = new int[maxVal - minVal + 1];

        //3. 遍历array数组 把值 放入 计数数组当中
        for (int i = 0; i < array.length; i++) {
            int val = array[i];//98
            count[val - minVal]++;
        }

        //4. 以上3步完成之后,计数数组 已经存好了对应的数据
        // 接下来 开始遍历 计数数组
        int index = 0;//array的下标
        for (int i = 0; i < count.length; i++) {
            while (count[i] > 0) {
                array[index] = i+minVal;
                index++;
                count[i]--;
            }
        }
    }

💸2.基数排序

基数排序(Radix sort)是一种非比较型整数排序算法,它的基本原理是将整数按位数切割成不同的数字,然后按每个位数分别比较。基数排序可以采用最低有效数字(LSD)或最高有效数字(MSD)的方式进行排序。

算法步骤

  1. 确定排序的位数,即确定需要比较的最大位数。
  2. 初始化10个桶(0-9),用于存放待排序的数字。
  3. 从最低位开始,将所有数字按照当前位的值放入对应的桶中。
  4. 将所有桶中的数字依次取出,按照桶的顺序重新排列原始数组。
  5. 重复步骤3和步骤4,直到所有位都被比较完毕。

时间复杂度

基数排序的时间复杂度取决于待排序数字的位数和桶的数量。如果有n个数字,每个数字有d位,基数排序的时间复杂度为O(d*n)。稳定性方面,基数排序是稳定的排序算法,即相等元素的相对顺序在排序前后保持不变。

适用性

  • 待排序的数字是整数类型,且位数相同。
  • 待排序的数字范围不太大,可以容易地确定排序的位数。
  • 可以使用辅助空间来存储桶和中间结果。

总结起来,基数排序是一种非比较型整数排序算法,通过按位数切割和桶的分配来实现排序。它具有稳定性和适用性的优点,并且时间复杂度与待排序数字的位数和桶的数量相关。

以下是动图演示

源代码 

/**
 * 基数排序
 * 考虑负数的情况还可以参考: https://code.i-harness.com/zh-CN/q/e98fa9
 */
public class RadixSort implements IArraySort {

    @Override
    public int[] sort(int[] sourceArray) throws Exception {
        // 对 arr 进行拷贝,不改变参数内容
        int[] arr = Arrays.copyOf(sourceArray, sourceArray.length);

        int maxDigit = getMaxDigit(arr);
        return radixSort(arr, maxDigit);
    }

    /**
     * 获取最高位数
     */
    private int getMaxDigit(int[] arr) {
        int maxValue = getMaxValue(arr);
        return getNumLenght(maxValue);
    }

    private int getMaxValue(int[] arr) {
        int maxValue = arr[0];
        for (int value : arr) {
            if (maxValue < value) {
                maxValue = value;
            }
        }
        return maxValue;
    }

    protected int getNumLenght(long num) {
        if (num == 0) {
            return 1;
        }
        int lenght = 0;
        for (long temp = num; temp != 0; temp /= 10) {
            lenght++;
        }
        return lenght;
    }

    private int[] radixSort(int[] arr, int maxDigit) {
        int mod = 10;
        int dev = 1;

        for (int i = 0; i < maxDigit; i++, dev *= 10, mod *= 10) {
            // 考虑负数的情况,这里扩展一倍队列数,其中 [0-9]对应负数,[10-19]对应正数 (bucket + 10)
            int[][] counter = new int[mod * 2][0];

            for (int j = 0; j < arr.length; j++) {
                int bucket = ((arr[j] % mod) / dev) + mod;
                counter[bucket] = arrayAppend(counter[bucket], arr[j]);
            }

            int pos = 0;
            for (int[] bucket : counter) {
                for (int value : bucket) {
                    arr[pos++] = value;
                }
            }
        }

        return arr;
    }

    /**
     * 自动扩容,并保存数据
     *
     * @param arr
     * @param value
     */
    private int[] arrayAppend(int[] arr, int value) {
        arr = Arrays.copyOf(arr, arr.length + 1);
        arr[arr.length - 1] = value;
        return arr;
    }
}

💳 3.桶排序

桶排序(Bucket sort)是一种非比较型的排序算法,它将待排序元素分为若干个区间(桶),然后将每个元素放入对应的桶中。每个桶内部使用其他排序算法(如插入排序)进行排序,最后按照桶的顺序依次输出各个桶中的元素。

基本原理:

  1. 确定桶的数量,可以根据待排序元素的范围和分布情况灵活设定。
  2. 将待排序元素依次放入对应的桶中。
  3. 对每个桶中的元素进行排序,可以选择其他排序算法。
  4. 按照桶的顺序依次输出各个桶中的元素,即得到有序序列。

算法步骤:

  1. 初始化桶和空数组,桶的数量根据待排序元素范围和分布情况确定。
  2. 遍历待排序元素,将每个元素放入对应的桶中。
  3. 对每个桶中的元素进行排序,可以使用插入排序等其他排序算法。
  4. 按照桶的顺序,将各个桶中的元素依次取出放入空数组中。
  5. 输出空数组,即得到有序序列。

时间复杂度: 桶排序的时间复杂度取决于元素的分布情况和桶的数量。在最均匀的情况下,平均时间复杂度和最佳时间复杂度均为O(n + k),其中n为元素个数,k为桶的数量。但在最差情况下,如果元素全部落在同一个桶中,则时间复杂度为O(n^2)。需要注意的是,桶排序的时间复杂度与元素大小无关。

稳定性:

桶排序是一种稳定的排序算法,即相等元素的相对顺序在排序前后保持不变。这是因为在将元素放入桶及桶内部排序时,采用了稳定的排序算法,如插入排序。

适用性: 

  • 待排序元素是均匀分布的。
  • 可以确定合适的桶的数量,以尽量减少桶之间元素的差距。
  • 桶内部的排序算法具有较高的效率。

源代码 

public static void bucketSort(int[] arr){
    
    // 计算最大值与最小值
    int max = Integer.MIN_VALUE;
    int min = Integer.MAX_VALUE;
    for(int i = 0; i < arr.length; i++){
        max = Math.max(max, arr[i]);
        min = Math.min(min, arr[i]);
    }
    
    // 计算桶的数量
    int bucketNum = (max - min) / arr.length + 1;
    ArrayList<ArrayList<Integer>> bucketArr = new ArrayList<>(bucketNum);
    for(int i = 0; i < bucketNum; i++){
        bucketArr.add(new ArrayList<Integer>());
    }
    
    // 将每个元素放入桶
    for(int i = 0; i < arr.length; i++){
        int num = (arr[i] - min) / (arr.length);
        bucketArr.get(num).add(arr[i]);
    }
    
    // 对每个桶进行排序
    for(int i = 0; i < bucketArr.size(); i++){
        Collections.sort(bucketArr.get(i));
    }
    
    // 将桶中的元素赋值到原序列
	int index = 0;
	for(int i = 0; i < bucketArr.size(); i++){
		for(int j = 0; j < bucketArr.get(i).size(); j++){
			arr[index++] = bucketArr.get(i).get(j);
		}
	}  
}

总结:桶排序是一种非比较型的排序算法,通过将元素放入对应的桶中,并对每个桶内部进行排序,最后按照桶的顺序输出得到有序序列。它的时间复杂度取决于元素的分布情况和桶的数量,稳定性较高,并适用于元素均匀分布的情况。

🧾七.总结与反思

人的成长要接受四个方面的教育:父母、老师、书籍,社会。有趣的是,后者似乎总是与前面三种背道而驰。

在学习了冒泡排序、快速排序、归并排序以及基于非比较的排序算法之后,我们可以对这些排序算法进行总结和反思。

冒泡排序

冒泡排序是一种简单的排序算法,其基本思想是将相邻的元素两两比较,如果前一个元素大于后一个元素,则交换这两个元素的位置。通过多次遍历整个数组,每次都将最大的元素"浮"到数组的末尾,从而实现排序。时间复杂度为O(n^2),不适用于大规模数据的排序。

快速排序

快速排序是一种高效的排序算法,其基本思想是选择一个基准值,将数组分为左右两部分,使得左半部分的所有元素小于等于基准值,右半部分的所有元素大于等于基准值,然后递归地对左右两部分排序。由于采用了分治的思想,并且在平均情况下时间复杂度为O(nlogn),因此快速排序是常用的排序算法之一。

归并排序

归并排序是一种稳定的排序算法,其基本思想是将待排序序列不断划分成更小的子序列,直到每个子序列只有一个元素,然后再将相邻的子序列合并成一个有序序列。由于采用了分治的思想,并且时间复杂度始终为O(nlogn),因此归并排序也是常用的排序算法之一。

非基于比较的排序算法

非基于比较的排序算法不需要进行元素之间的比较,因此它们常常具有线性的时间复杂度,但是空间复杂度较高。这类算法包括计数排序、桶排序和基数排序等。

总体来说,不同的排序算法适用于不同的场景,我们需要根据具体的问题和数据特点选择合适的排序算法。同时,我们还应该注意算法的时间复杂度、稳定性和空间复杂度等方面,以便在实际应用中能够达到更好的效果。


🍀🍀🍀🍀🍀🍀🍀🍀🍀🍀🍀🍀🍀🍀🍀🍀🍀🍀🍀🍀🍀🍀🍀🍀🍀🍀🍀🍀

以上,就是本期的全部内容啦,若有错误疏忽希望各位大佬及时指出💐

  制作不易,希望能对各位提供微小的帮助,可否留下你免费的赞呢🌸


网站公告

今日签到

点亮在社区的每一天
去签到