一篇夯实一个知识点系列－－python实现十大排序算法

写在前面

排序是查找是算法中最重要的两个概念，我们大多数情况下都在进行查找和排序。科学家们穷尽努力，想使得排序和查找能够更加快速。本篇文章用Python实现十大排序算法。

干货儿

排序算法从不同维度可以分为好多类别，从其排序思想(排序思想一般决定了其时间复杂度的量级)来看，主要可以分为四类：
双层循环比较排序：平方级排序
分治策略比较排序：对数级排序
另辟蹊径的非比较方式排序：线性级排序
笑死人不偿命的其它排序：有着天马行空的时间复杂度，难以描述。

平方级排序

冒泡排序
1. 从数组的第一个元素开始，比较当前元素和下一个元素，如果当前元素大于下一个元素，交换两元素位置。
2. 接着从第二个元素开始，重复第一步，直到当前元素为最后一个元素。此时最后一个元素为最大元素。未排序数组为除最后一个元素之外的其它元素。
3. 对未排序数组不断重复以上步骤，直到未排序数组为空。
```
def bubble_sort(arr):
    length = len(arr)
    for i in range(length):
        for j in range(length-i-1):
            if arr[j] > arr[j+1]:
                arr[j], arr[j+1] = arr[j+1], arr[j]
    return arr
```
选择排序
1. 选取数组中的最小元素，和数组中的第一个元素交换位置
2. 选取数组中除第一个元素外剩余元素的最小元素，和数组中的第二个元素交换位置。
3. 不断重复以上步骤，直到当前选取的元素为数组中最后一个元素。
```
def select_sort(arr):
    length = len(arr)
    for i in range(length):
        min_ix = i
        for j in range(i, length):
            if arr[j] < arr[min_ix]:
                min_ix = j
        arr[min_ix], arr[i] = arr[i], arr[min_ix]
    return arr
```
插入排序
1. 从数组的第一个元素开始，不断比较当前元素和前一个元素。如果当前元素比前一个元素小，那么就将当前元素插入到前一个元素的前面(即两者交换位置)
2. 从第二个元素开始，不断重复以上步骤，直到所有元素全部经历上述步骤。
```
def insert_sort(arr):
    length = len(arr)
    for i in range(length):
        for j in range(i, 0, -1):
            if arr[j] < arr[j-1]:
                arr[j], arr[j-1] = arr[j-1], arr[j]
    return arr
```

对数级排序

希尔排序

选择一个增量值k，分别将数组中索引以k为间隔的元素放在同一个数组中。
将增量值缩小为原增量值的1/2，然后重复步骤1。
直到增量值为1，使用插入排序对已经部分有序的数组进行排序。

def shell_sort(arr):
    n = len(arr)
    gap = int(n/2)
    while gap > 0: 
        for i in range(gap,n): 
            temp = arr[i] 
            j = i 
            while  j >= gap and arr[j-gap] >temp: 
                arr[j] = arr[j-gap] 
                j -= gap 
            arr[j] = temp 
        gap = int(gap/2)
    return arr

归并排序

以数组中间元素为界，将数组分为等长的两个数组(可能不等长，和数组长度的奇偶性有关)。
对所有数组执行步骤1
不断重复以上步骤，直到将数组分割为多个包含单个元素的数组。
将以上数组两两合并，并排序，此时为多个包含有序的两个元素的数组(可能包含单个元素，跟数组长度的奇偶性有关)。
重复步骤4，直到将所有数组合并为一个数组

def merge(left, right):
    i = j = 0
    res = []
    while i < len(left) and j < len(right):
        if left[i] < right[j]:
            res.append(left[i])
            i += 1
        else:
            res.append(right[j])
            j += 1
    if i == len(left):
        res.extend(right[j:])
    else:
        res.extend(left[i:])
    return res

def merge_sort(arr):
    if len(arr) <= 1:
        return arr
    length = len(arr)
    i = int(length / 2)
    left = merge_sort(arr[:i])
    right = merge_sort(arr[i:])
    return merge(left, right)

快速排序

挑选一个元素为基准
比基准大的元素作为一个数组，比基准小或者等于基准的元素作为一个数组。
对新分割的数组，不断重复以上步骤，直到分割后的数组只含有1个或者0个元素
递归地合并以上数组为有序数组，合并方式为：[小于等于基准的元素]+[基准]+[大于基准的元素]

def fast_sort(arr):
    if len(arr) <= 1:
        return arr
    pivot = arr.pop()
    left = [i for i in arr if i <= pivot]
    right = [i for i in arr if i > pivot]
    return fast_sort(left) + [pivot] + fast_sort(right)

以上算法需要额外的空间，如果我们将小于等于基准的元素不断置于基准元素之前，大于基准的元素置于基准元素之后，那么就可以实现不需要额外空间的就地排序。

def fast_sort_on_extra_spacing(arr):
    l = 0
    h = len(arr)-1

    def partition(arr, l, h):
        pivot = arr[h]
        for i in range(l, h):
            if arr[i] <= pivot:
                arr[l], arr[i] = arr[i], arr[l]
                l += 1
        arr[h], arr[l] = arr[l], arr[h]
        return l

    def fast_sort(arr, l, h):
        if l < h:
            pivot = partition(arr, l, h)
            fast_sort(arr, l, pivot-1)
            fast_sort(arr, pivot+1, h)
        return arr
    return fast_sort(arr, l, h)

堆排序

先对待排序数组构造大根堆
将大根堆第一个元素和最后一个元素交换位置。此时最后一个元素为最大元素，待排序数组为除最后一个元素之外的所有元素。
对待排序数组不断重复以上步骤，直到待排序数组中只有一个元素。

def heapify(arr, n, i):
    # build a max root heap
    max_ix = i
    left_i = 2 * i + 1
    right_i = 2 * i + 2

    if left_i < n and arr[max_ix] < arr[left_i]:
        max_ix = left_i
    if right_i < n and arr[max_ix] < arr[right_i]:
        max_ix = right_i
    if max_ix != i:
        arr[max_ix], arr[i] = arr[i], arr[max_ix] 
        heapify(arr, n, max_ix)

def heap_sort(arr):
    for i in range(n-1, -1, -1):
        heapify(arr, n, i)

    for i in range(n-1, 0, -1):
        arr[i], arr[0] = arr[0], arr[i]
        heapify(arr, i, 0)
    return arr

线性级排序

此排序方法只适用于数组元素全部为整数的情景。

计数排序
1. 找出待排序数组中最大的元素，构造一个长度为此元素值的计数数组。
2. 遍历待排序数组元素，以当前元素为索引，将计数数组中的对应值加1.
3. 此时计数数组中的索引为待排序数组中的元素，值为出现的次数。将计数数组中所有值非0的元素索引根据其出现次数串联起来。
```
def count_sort(arr):
    min_ix, max_ix = min(arr), max(arr)
    bucket = [0 for _ in range(max_ix+1)]
    for i in arr:
        bucket[i] += 1
    return sum([[i] * bucket[i] for i in range(len(bucket)) if bucket[i] != 0], [])
```

桶排序

设置固定数量的桶(这是个技术活儿).
将待排序数组中的元素放入对应的桶中(对应关系也是个技术活儿，下面的例子中采用整除)
将非空桶中的元素串联起来。

def bucket_sort(arr):
    min_ix, max_ix = min(arr), max(arr)
    bucket_range = (max_ix - min_ix) / len(arr)
    # +1 avoid for that max_ix - min_ix will raise a IndexError
    temp_bucket = [[] for i in range(len(arr) + 1)]
    for i in arr:
        temp_bucket[int((i-min_ix)//bucket_range)].append(i)
    return sum(temp_bucket, [])

基数排序

找出待排序数组中最大元素的位数。将所有元素补足此位数，补足方式为前面补0。
从最低位到最高位，进行多轮数组排序。

def radix_sort(arr):
    max_value = max(arr)
    num_digits = len(str(max_value))
    for i in range(num_digits):
        bucket = [[] for _ in range(10)]
        for j in arr:
            bucket[j//(10**i)%10].append(j)
        arr = [j for i in bucket for j in i]
    return arr

笑死人不偿命排序

睡排序
让多个进程(线程)分别睡眠待排序数组中的元素时长，先睡醒的进程(线程)，对应元素追加到结果数组中。
猴子排序
不停随机排序，然后检查是否元素全部有序。如果你是欧皇，那么你可以尝试用这个排序算法，很可能一次搞定。

排序算法复杂度、稳定性及通用性总结

算法	平均时间复杂度	最优时间复杂度	最坏时间复杂度	空间复杂度	是否原地排序	是否稳定	是否通用
冒泡排序	O(n²)	O(n)	O(n²)	O(1)	是	是	是
选择排序	O(n²)	O(n²)	O(n²)	O(1)	是	否	是
插入排序	O(n²)	O(n)	O(n²)	O(1)	是	是	是
希尔排序	O(n logn)	O(n log²n)	O(n log²n)	O(1)	是	否	是
归并排序	O(n logn)	O(n logn)	O(n logn)	O(n)	否	是	是
快速排序	O(n logn)	O(n logn)	O(n²)	O(n logn)	是	否	是
堆排序	O(n logn)	O(n logn)	O(n logn)	O(1)	是	否	是
计数排序	O(n+k)	O(n+k)	O(n+k)	O(k)	否	是	否
桶排序	O(n+k)	O(n+k)	O(n²)	O(n+k)	否	是	否
基数排序	O(n*k)	O(n*k)	O(n*k)	O(n+k)	否	是	否

写在最后

排序算法是算法学习中的核心。掌握排序算法及其思想是学习其它算法的基础。希望大家可以熟练掌握。欢迎关注个人博客:药少敏的博客。

一篇夯实一个知识点系列－－python实现十大排序算法

写在前面

干货儿

平方级排序

对数级排序

线性级排序

笑死人不偿命排序

排序算法复杂度、稳定性及通用性总结

写在最后

药少敏

引用和评论

🔥全程不用写代码，我用 AI 程序员写了一个飞机大战

LRU算法，你别跑，我就要吃透你

大模型中的Token究竟是什么？从原理到作用深度解析

Anaconda安装教程以及Anaconda和pip配置国内镜像

如何减少跨团队交付摩擦？——基于 DevOps 与敏捷的最佳实践

Python 描述符

科学计算编程涉及到的技术栈简介