file

算法一直是计算机学科中一个非常核心的内容,学习大黑书可以让我们年轻人得到充沛的力量(也就是少点头发),在程序的海洋里快乐徜徉。

file

排序算法是算法之中一个既基础又核心的内容,而快速排序则是比较排序中的佼佼者。今天我们就一起来探究一下快速排序。

普通快速排序

快速排序是一个经典的分治算法,解决分治问题的三个步骤就是 分解、解决、合并

拆开来看看快速排序的基本思想:

分解 :将输入数组A[l..r]划分成两个子数组的过程。选择一个p,使得A被划分成三部分,分别是A[l..p-1],A[p]和A[p+1..r]。并且使得A[l..p-1]中的元素都小于等于A[p],同时A[p]小于等于A[p+1..r]中的所有元素。

解决:递归调用快速排序,解决分解中划分生成的两个子序列的排序。

合并:因为子数组都是原址排序的,所以无需进行合并操作,数组A[p..r]已经有序。

算法导论书上给出了简单易懂的伪代码,我在这直接给出Python的实现代码

def Quick_Sort(A,p,r):
    if p<r:
        q=Partition(A,p,r)
        Quick_Sort(A,p,q-1)
        Quick_Sort(A,q,r)
        
def Partition(A,p,r):
    x=A[r]
    i=p-1
    for j in range(p,r):
        if A[j]<=x:
            i+=1
            A[i],A[j]=A[j],A[i]
    A[i+1],A[r]=A[r],A[i+1]
    return i+1

这里看到数组的划分是直接选择了子数组的最后一个元素,那么当待排序列已经有序时,划分出的子序列便有一个序列是不含任何元素的,这使得排序的性能变差。为了改善这种情况,我们可以选择引入一个随机量来破坏有序状态。

快速排序的随机化版本

我们可以通过在选择划分时随机选择一个主元来实现随机快速排序。仅需对上述代码做出小小的改动。

def Quick_Sort_Random(A,p,r):
    if p<r:
        q=Partition1(A,p,r)
        Quick_Sort(A,p,q-1)
        Quick_Sort(A,q,r)
     
def Partition1(A,p,r):
    k=random.randint(p,r)
    A[k],A[r]=A[r],A[k]

    return Partition(A,p,r)

性能比较

是骡子是马我们拉出来溜溜,我对两种快排的性能做了一个简单的测试。首先是一定数量的随机序列,运行的时间单位为秒,下表中的结果是经多次运行所取得的平均值。

方法 $10^3$ $10^4$ $10^5$ $10^6$ $10^7$ 5*$10^7$ $10^8$
普通快排 0.00204557 0.02453995 0.32335813 4.83641084 63.91342704 456.20516078 1176.27041785
随机快排 0.00228848 0.03292949 0.39734049 5.41323487 66.26046769 451.38552999 1108.05737074

也可以使用可视化的方法将上表变得更加清楚,普通排序在数据量较小时具有一定的性能优势,随机快排可能是因为添加了随机选择这一项操作而影响了部分性能,但是随着数据量进一步增大,两者之间的性能会非常接近。

file

接下来是对有序序列进行测试,

方法 $10^3$ $10^4$ $10^5$ $10^6$
普通快排 0.06262696 / / /
随机快排 0.03440228 0.45189877 7.28055120 95.54553382

普通快排在数据量非常小的时候就把栈给挤爆喽,从另一侧面反映出随机快排的必要性,在处理比较极端也就是完全有序的序列时具有较大的优势~


librauee
90 声望222 粉丝

工科转行 硕士在读