7种常用的排序算法总结

排序算法：一种能将一串数据依照特定的排序方式进行排列的一种算法。
排序算法性能：取决于时间和空间复杂度，其次还得考虑稳定性，及其适应的场景。
稳定性：让原本有相等键值的记录维持相对次序。也就是若一个排序算法是稳定的，当有俩个相等键值的记录R和S，且原本的序列中R在S前，那么排序后的列表中R应该也在S之前。

1-冒泡排序

原理
俩俩比较相邻记录的排序码，若发生逆序，则交换；有俩种方式进行冒泡，一种是先把小的冒泡到前边去，另一种是把大的元素冒泡到后边。冒泡法大家都较熟悉。其原理为从a[0]开始，依次将其和后面的元素比较,若a[0]>a[i]，则交换它们，一直比较到a[n]。同理对a[1],a[2],…a[n-1]处理，即完成排序

冒泡排序的基本概念：

依次比较相邻的两个数，将小数放在前面，大数放在后面。即在第一趟：首先比较第1个和第2个数，将小数放前，大数放后。然后比较第2个数和第3个数，将小数放前，大数放后，如此继续，直至比较最后两个数，将小数放前，大数放后。至此第一趟结束，将最大的数放到了最后。在第二趟：仍从第一对数开始比较（因为可能由于第2个数和第3个数的交换，使得第1个数不再小于第2个数），将小数放前，大数放后，一直比较到倒数第二个数（倒数第一的位置上已经是最大的），第二趟结束，在倒数第二的位置上得到一个新的最大数（其实在整个数列中是第二大的数）。如此下去，重复以上过程，直至最终完成排序。由于在排序过程中总是小数往前放，大数往后放，相当于气泡往上升，所以称作冒泡排序。

实现：

外循环变量设为i，内循环变量设为j。假如有10个数需要进行排序，则外循环重复9次，内循环依次重复9，8，…，1次。每次进行比较的两个元素都是与内循环j有关的，它们可以分别用a[j]和a[j+1]标识，i的值依次为1,2,…,9，对于每一个i,j的值依次为1,2,…10-i。

图示：
![此处输入图片的描述][1]

性能
时间复杂度为O(N^2)，空间复杂度为O(1)。排序是稳定的，排序比较次数与初始序列无关，但交换次数与初始序列有关。

优化
若初始序列就是排序好的，对于冒泡排序仍然还要比较O(N^2)次，但无交换次数。可根据这个进行优化，设置一个flag，当在一趟序列中没有发生交换，则该序列已排序好，但优化后排序的时间复杂度没有发生量级的改变

代码

#include<stdio.h>
void sort(int *a,int len)
{
    int i,j,t;
    
    for( i = 0;i<len-1;++i)
    {
        for(j = 0;j<len-1-i;++j) 或者 j=i+1;j<len;++j
        {
            if(a[j] >a[j+1])
            {
                t  = a[j];
                a[j] = a[j+1];
                a[j+1] = t;
            }
        }
    }
        
}
void main()
{
    int a[6] = {10,2,8,-8,11,0};
    int i = 0;
    sort(a,6);
    
    for(i = 0; i<6;++i)
    {
        printf("%d ",a[i]);
    }
    printf("\n");
}

冒泡法原理简单，但其缺点是交换次数多，效率低。下面介绍一种源自冒泡法但更有效率的方法“选择法”。

2-选择排序

原理
每次从未排序的序列中找到最小值，记录并最后存放到已排序序列的末尾.选择法循环过程与冒泡法一致，它还定义了记号k=i,然后依次把a[k]同后面元素比较，若a[k]>a[j],则使k=j.最后看看k=i是否还成立，不成立则交换a[k],a[i],这样就比冒泡法省下许多无用的交换，提高了效率。

性能
时间复杂度为O(N^2)，空间复杂度为O(1)，排序是不稳定的（把最小值交换到已排序的末尾导致的），每次都能确定一个元素所在的最终位置，比较次数与初始序列无关。

代码

//直接选择排序
#include<stdio.h>
void sort(int *a,int len)
{
  int i,j,min,t;
  for(i = 0;i<len-1;++i)
  {
    for(min=i,j=i+1;j<len;++j)
    {
      if(a[min]>a[j])
        min = j;
    }
    if(min!=i)
    {
      t = a[i];
      a[i] = a[min];
      a[min] = t;
    }
  }
}
void main()
{
  int a[6] = {4,0,3,2,5,1};
  sort(a,6);//a代表数组的首地址
  for(int i=0;i<6;++i)
    printf("%d\n",a[i]);
}

选择法比冒泡法效率更高，但说到高效率，非“快速法”莫属，现在就让我们来了解它。

3-快速排序

原理
基本思想：

快速排序是对冒泡排序的一种改进。由C. A. R. Hoare在1962年提出。它的基本思想是：通过一趟排序将要排序的数据分割成独立的两部分，其中一部分的所有数据都比另外一部分的所有数据都要小，然后再按此方法对这两部分数据分别进行快速排序，整个排序过程可以递归进行，以此达到整个数据变成有序序列。

实现：
设要排序的数组是A[0]……A[N-1]，首先任意选取一个数据（通常选用第一个数据）作为关键数据，然后将所有比它小的数都放到它前面，所有比它大的数都放到它后面，这个过程称为一趟快速排序。值得注意的是，快速排序不是一种稳定的排序算法，也就是说，多个相同的值的相对位置也许会在算法结束时产生变动。

一趟快速排序的算法是：
1）设置两个变量i、j，排序开始的时候：i=0，j=N-1；
2）以第一个数组元素作为关键数据，赋值给key，即 key=A[0]；
3）从j开始向前搜索，即由后开始向前搜索（j – ），找到第一个小于key的值A[j]，A[i]与A[j]交换；
4）从i开始向后搜索，即由前开始向后搜索（i ++ ），找到第一个大于key的A[i]，A[i]与A[j]交换；
5）重复第3、4、5步，直到 I=J； (3,4步是在程序中没找到时候j=j-1，i=i+1，直至找到为止。找到并交换的时候i， j指针位置不变。另外当i=j这过程一定正好是i+或j-完成的最后令循环结束。）

图示：
![此处输入图片的描述][2]

举例说明：

如无序数组[6 2 4 1 5 9]

a),先把第一项[6]取出来,
- 用[6]依次与其余项进行比较,
- 如果比[6]小就放[6]前边,2 4 1 5都比[6]小,所以全部放到[6]前边
- 如果比[6]大就放[6]后边,9比[6]大,放到[6]后边,//6出列后大喝一声,比我小的站前边,比我大的站后边,行动吧!霸气十足~

一趟排完后变成下边这样:

排序前 6 2 4 1 5 9
排序后 2 4 1 5 6 9

b),对前半拉[2 4 1 5]继续进行快速排序

重复步骤a)后变成下边这样:

排序前 2 4 1 5
排序后 1 2 4 5

前半拉排序完成,总的排序也完成:

排序前:[6 2 4 1 5 9]
排序后:[1 2 4 5 6 9]

性能
快排的平均时间复杂度为O(NlogN），空间复杂度为O(logN)，但最坏情况下，时间复杂度为O(N^2)，空间复杂度为O(N)；且排序是不稳定的，但每次都能确定一个元素所在序列中的最终位置，复杂度与初始序列有关。

优化
当初始序列是非递减序列时，快排性能下降到最坏情况，主要因为基准每次都是从最左边取得，这时每次只能排好一个元素。
所以快排的优化思路如下：

优化基准，不每次都从左边取，可以进行三路划分，分别取最左边，中间和最右边的中间值，再交换到最左边进行排序；或者进行随机取得待排序数组中的某一个元素，再交换到最左边，进行排序。
在规模较小情况下，采用直接插入排序
代码

//快速排序
#include<stdio.h>
int FindPos(int * a, int low, int high)
{
  int val = a[low];
  while (low < high)
  {
    while (low<high  && a[high]>=val)
      --high;
    a[low] = a[high];
    while (low<high && a[low]<=val)
      ++low;
    a[high] = a[low];
  }//终止while循环之后low和high一定是相等的
  a[low] = val; 
  return high; //high可以改为low, 但不能改为val 也不能改为a[low]  也不能改为a[high]
}
void QuickSort(int *a,int low,int high)
{
  int pos;
  if(low<high)
  {
    pos = FindPos(a,low,high);//找到a数组下标low-high  
    QuickSort(a,low,pos-1);//把元素劈成两半  左半边
    QuickSort(a,pos+1,high);//右半边
  }
}
void main()
{
  int i;
  int a[6] = {2,1,3,0,5,4};
  QuickSort(a,0,5);//0表示第一个元素下标 5表示最后一个元素的下标
  
  for(i = 0;i<6;++i)
    printf("%d\n",a[i]);
}

4-插入排序

原理
依次选择一个待排序的数据，插入到前边已排好序的序列中。

性能
时间复杂度为O(N^2)，空间复杂度为O(1)。算法是稳定的，比较次数和交换次数都与初始序列有关。

优化
直接插入排序每次往前插入时，是按顺序依次往前找，可在这里进行优化，往前找合适的插入位置时采用二分查找的方式，即折半插入。
折半插入排序相对直接插入排序而言：平均性能更快，时间复杂度降至O(NlogN)，排序是稳定的，但排序的比较次数与初始序列无关，总是需要foor(log(i))+1次排序比较。

使用场景
当数据基本有序时，采用插入排序可以明显减少数据交换和数据移动次数，进而提升排序效率

代码：

void insert_sort(int *a,int n) 
{ 
    
    int i,j,temp; 
    
    for(i=1;i<n;i++) 
    { 
    
        temp=a[i]; /*temp为要插入的元素*/ 
        
        j=i-1; 
        
        while(j>=0&&temp<a[j]) 
        { 
            /*从a[i-1]开始找比a[i]小的数，同时把数组元素向后移*/ 
            
            a[j+1]=a[j]; 
            
            j--; 
    
        } 
    
         a[j+1]=temp; /*插入*/ 
    
    } 
}

5-希尔排序

原理

Shell法是一个叫 shell 的美国人与1969年发明的。它首先把相距k(k>=1)的那几个元素排好序，再缩小k值（一般取其一半），再排序，直到k=1时完成排序

插入排序的改进版，是基于插入排序的以下俩点性质而提出的改进方法：

插入排序对几乎已排好序的数据操作时，效率很高，可以达到线性排序的效率。
但插入排序在每次往前插入时只能将数据移动一位，效率比较低。

性能
开始时，gap取值较大，子序列中的元素较少，排序速度快，克服了直接插入排序的缺点；其次，gap值逐渐变小后，虽然子序列的元素逐渐变多，但大多元素已基本有序，所以继承了直接插入排序的优点，能以近线性的速度排好序。

void shell_sort(int *a,int n) 
{ 
    int i,j,k,x; 
    
    k=n/2; /*间距值*/ 
    
    while(k>=1) 
    { 
    
        for(i=k;i<n;i++)
        { 
        
                x=a[i]; 
                
                j=i-k; 
                
                while(j>=0&&x<a[j]) 
                { 
                    
                    a[j+k]=a[j]; 
                    
                    j-=k; 
                } 
                
                   a[j+k]=x;    
                
        } 
                
                k/=2; /*缩小间距值*/ 
        
    } 
}

6-归并排序

原理

分而治之思想：

Divide：将n个元素平均划分为各含n/2个元素的子序列；
Conquer：递归的解决俩个规模为n/2的子问题；
Combine：合并俩个已排序的子序列。

性能
时间复杂度总是为O(NlogN)，空间复杂度也总为为O(N)，算法与初始序列无关，排序是稳定的。

优化
优化思路：

在规模较小时，合并排序可采用直接插入；
在写法上，可以在生成辅助数组时，俩头小，中间大，这时不需要再在后边加俩个while循环进行判断，只需一次比完

//归并排序
void merge(int arr[],int temp_arr[],int left,int mid, int right){
    //简单归并：先复制到temp_arr，再进行归并
    for (int i = left; i <= right; i++){
        temp_arr[i] = arr[i];
    }
    int pa = left, pb = mid + 1;
    int index = left;
    while (pa <= mid && pb <= right){
        if (temp_arr[pa] <= temp_arr[pb]){
            arr[index++] = temp_arr[pa++];
        }
        else{
            arr[index++] = temp_arr[pb++];
        }
    }
    while(pa <= mid){
        arr[index++] = temp_arr[pa++];
    }
    while (pb <= right){
        arr[index++] = temp_arr[pb++];
    }
}
void merge_improve(int arr[], int temp_arr[], int left, int mid, int right){
    //优化归并：复制时，俩头小，中间大，一次比较完
    for (int i = left; i <= mid; i++){
        temp_arr[i] = arr[i];
    }
    for (int i = mid + 1; i <= right; i++){
        temp_arr[i] = arr[right + mid + 1 - i];
    }
    int pa = left, pb = right, p = left;
    while (p <= right){
        if (temp_arr[pa] <= temp_arr[pb]){
            arr[p++] = temp_arr[pa++];
        }else{
            arr[p++] = temp_arr[pb--];
        }
    }
}
void merge_sort(int arr[],int temp_arr[], int left, int right){
    if (left < right){
        int mid = (left + right) / 2;
        merge_sort(arr,temp_arr,0, mid);
        merge_sort(arr, temp_arr,mid + 1, right);
        merge(arr,temp_arr,left,mid,right);
    }
}
void merge_sort(int arr[], int len){
    int *temp_arr = (int*)malloc(sizeof(int)*len);
    merge_sort(arr,temp_arr, 0, len - 1);
}

7-堆排序

原理

堆的性质：

是一棵完全二叉树
每个节点的值都大于或等于其子节点的值，为最大堆；反之为最小堆。

堆排序思想：

将待排序的序列构造成一个最大堆，此时序列的最大值为根节点
依次将根节点与待排序序列的最后一个元素交换
再维护从根节点到该元素的前一个节点为最大堆，如此往复，最终得到一个递增序列

性能
时间复杂度为O(NlogN)，空间复杂度为O(1)，因为利用的排序空间仍然是初始的序列，并未开辟新空间。算法是不稳定的，与初始序列无关。

使用场景
想知道最大值或最小值时，比如优先级队列，作业调度等场景。

代码

/**
     * 将数组arr构建大根堆
     * @param arr 待调整的数组
     * @param i   待调整的数组元素的下标
     * @param len 数组的长度
     */
    void heap_adjust(int arr[], int i, int len)
    {
        int child;
        int temp;
    
        for (; 2 * i + 1 < len; i = child)
        {
            child = 2 * i + 1;  // 子结点的位置 = 2 * 父结点的位置 + 1
            // 得到子结点中键值较大的结点
            if (child < len - 1 && arr[child + 1] > arr[child])
                child ++;
            // 如果较大的子结点大于父结点那么把较大的子结点往上移动，替换它的父结点
            if (arr[i] < arr[child])
            {
                temp = arr[i];
                arr[i] = arr[child];
                arr[child] = temp;
            }
            else
                break;
        }
    }
    
    /**
     * 堆排序算法
     */
    void heap_sort(int arr[], int len)
    {
        int i;
        // 调整序列的前半部分元素，调整完之后第一个元素是序列的最大的元素
        for (int i = len / 2 - 1; i >= 0; i--)
        {
            heap_adjust(arr, i, len);
        }
    
        for (i = len - 1; i > 0; i--)
        {
            // 将第1个元素与当前最后一个元素交换，保证当前的最后一个位置的元素都是现在的这个序列中最大的
            int temp = arr[0];
            arr[0] = arr[i];
            arr[i] = temp;
            // 不断缩小调整heap的范围，每一次调整完毕保证第一个元素是当前序列的最大值
            heap_adjust(arr, 0, i);
        }
    }