目录
前言
归并排序是建立在归并操作上的一种有效,稳定的排序算法,该算法是采用分治法(Divide and Conquer)的一个非常典型的应用。将已有序的子序列合并,得到完全有序的序列;即先使每个子序列有序,再使子序列段间有序。若将两个有序表合并成一个有序表,称为二路归并。来自百度百科。
归并思想
假设我们现在有着[10, 6, 7, 1, 3, 9, 4, 2]这样的一个序列需要进行排序,以升序排序为例,如果我们每一次都把这个进行二分划分成左右两个区间,再将子区间二分划分成又一左右两个子区间,依次往下划分直至区间只有一个元素时不再划分,如下图所示。
当区间划分完了就开始归并了,此时每个区间都只有一个元素,就很容易比较他们的大小了,例如区间10和区间6经过比较后的顺序可变为[6, 10],然后再将[6, 10]这一序列返回给上一次递归调用的[10, 6],这样区间[10, 6]就变为区间[6, 10]了,其他区间以此类推,如下图所示,建议多画几次递归调用图就比较好理解了。
归并排序需要开辟一个与原数组大小相同的tmp数组用于存储归并后的数据,这样才能够记录归并后的这个有序区间,再将每一次归并后的tmp数组拷贝回原数组,当所有区间都归并好后原数组就有序了。
递归实现
实现代码:
void _MergeSort(int* a, int begin, int end, int* tmp)
{
if (begin >= end)
return;
int mid = (begin + end) / 2;
//划分左右区间
//闭区间begin + end == 4, 必须是要mid和mid+1
//[begin, mid] , [mid+1, end]分治递归,让子区间有序
_MergeSort(a, begin, mid, tmp);
_MergeSort(a, mid + 1, end, tmp);
//二路归并
int begin1 = begin, begin2 = mid + 1;
int end1 = mid, end2 = end;
//等于表示两个区间都是只有一个数
int i = begin;
while (begin1 <= end1 && begin2 <= end2)
{
if (a[begin1] < a[begin2])
{
tmp[i++] = a[begin1++];
}
else
{
tmp[i++] = a[begin2++];
}
}
//至此,可能会出现一个区间走完了,另一区间可能还未走完
while (begin1 <= end1)
{
tmp[i++] = a[begin1++];
}
while (begin2 <= end2)
{
tmp[i++] = a[begin2++];
}
//每一次都把归并后的数据拷贝回原数组,当归并完所有区间原数组就有序了
//在递归中并不是每个区间的起始位置都是0,所以需要加上begin
memcpy(a + begin, tmp + begin, sizeof(int) * (end - begin + 1));
}
//归并排序
//时间复杂度O(N*logN),每一层都是N,一共有logN层
//空间的复杂度O(N)
void MergeSort(int* a, int n)
{
//归并排序需要一个额外的数组去存放归并后的数据
int* tmp = (int*)malloc(n * sizeof(int));
if (tmp == NULL)
{
printf("malloc fail\n");
exit(-1);
}
//归并
_MergeSort(a, 0, n - 1, tmp);
//malloc出来的空间一定要释放
free(tmp);
}
测试代码:
void PrintArry(int* a, int n)
{
for (int i = 0; i < n; i++)
{
printf("%d ", a[i]);
}
printf("\n");
}
void TestMergeSort()
{
int a[] = { 9, 1, 2, 5, 7, 4, 8, 6, 3, 5 };
MergeSort(a, sizeof(a) / sizeof(int));
PrintArry(a, sizeof(a) / sizeof(int));
}
int main()
{
//TestInsertSort();
//TestHeapSort();
//TestShellSort();
//TestSelectSort();
//TestBubbleSort();
//TestQuickSort();
//TestQuickSortNonR();
TestMergeSort();
//TestMergeSortNonR();
//TestCountSort();
return 0;
}
测试结果:
非递归实现
归并排序的非递归实现较为复杂,可以采用手动归并较为合适,第一次归并1个元素和1个元素归,第二次2个元素和2个元素归,第三次4个元素和4个元素归,以此类推直至一次归并元素个数大于等于数组大小而结束。
但是需要注意到此处数组大小是2的倍数,如果数组大小不是2得倍数呢?显然,按照上边的11归、22归、44归……走下去,那么非2的倍数的数组大小则会存在越界问题,需要对边界进行处理。
非递归实现代码:
void MergeSortNonR(int* a, int n)
{
int* tmp = (int*)malloc(sizeof(int) * n);
if (tmp == NULL)
{
printf("malloc fail!\n");
exit(-1);
}
int gap = 1;
while (gap < n)
{
for (int i = 0; i < n; i += 2 * gap)
{
int begin1 = i, begin2 = i + gap;
int end1 = i + gap - 1, end2 = i + 2 * gap - 1;
//元素个数未必是2的倍数
// end1越界或者begin2越界,则可以不归并了
if (end1 >= n || begin2 >= n)
{
break;
}
else if (end2 >= n)
{
end2 = n - 1;
}
//等于表示两个区间都是只有一个数
int m = end2 - begin1 + 1;
int j = begin1;
while (begin1 <= end1 && begin2 <= end2)
{
if (a[begin1] < a[begin2])
{
tmp[j++] = a[begin1++];
}
else
{
tmp[j++] = a[begin2++];
}
}
while (begin1 <= end1)
{
tmp[j++] = a[begin1++];
}
while (begin2 <= end2)
{
tmp[j++] = a[begin2++];
}
memcpy(a + i, tmp + i, sizeof(int) * m);
}
gap *= 2;
}
free(tmp);
}
测试代码:
void PrintArry(int* a, int n)
{
for (int i = 0; i < n; i++)
{
printf("%d ", a[i]);
}
printf("\n");
}
void TestMergeSortNonR()
{
int a[] = { 9, 1, 2, 5, 7, 4, 8, 6, 3, 5 };
MergeSortNonR(a, sizeof(a) / sizeof(int));
PrintArry(a, sizeof(a) / sizeof(int));
}
int main()
{
//TestInsertSort();
//TestHeapSort();
//TestShellSort();
//TestSelectSort();
//TestBubbleSort();
//TestQuickSort();
//TestQuickSortNonR();
//TestMergeSort();
TestMergeSortNonR();
//TestCountSort();
return 0;
}
测试结果: