算法一直是计算机学科中一个非常核心的内容,学习大黑书可以让我们年轻人得到充沛的力量(也就是少点头发),在程序的海洋里快乐徜徉。
排序算法是算法之中一个既基础又核心的内容,而快速排序则是比较排序中的佼佼者。今天我们就一起来探究一下快速排序。
普通快速排序
快速排序是一个经典的分治算法,解决分治问题的三个步骤就是 分解、解决、合并。
拆开来看看快速排序的基本思想:
分解 :将输入数组A[l..r]划分成两个子数组的过程。选择一个p,使得A被划分成三部分,分别是A[l..p-1],A[p]和A[p+1..r]。并且使得A[l..p-1]中的元素都小于等于A[p],同时A[p]小于等于A[p+1..r]中的所有元素。
解决:递归调用快速排序,解决分解中划分生成的两个子序列的排序。
合并:因为子数组都是原址排序的,所以无需进行合并操作,数组A[p..r]已经有序。
算法导论书上给出了简单易懂的伪代码,我在这直接给出Python的实现代码
def Quick_Sort(A,p,r):
if p<r:
q=Partition(A,p,r)
Quick_Sort(A,p,q-1)
Quick_Sort(A,q,r)
def Partition(A,p,r):
x=A[r]
i=p-1
for j in range(p,r):
if A[j]<=x:
i+=1
A[i],A[j]=A[j],A[i]
A[i+1],A[r]=A[r],A[i+1]
return i+1
这里看到数组的划分是直接选择了子数组的最后一个元素,那么当待排序列已经有序时,划分出的子序列便有一个序列是不含任何元素的,这使得排序的性能变差。为了改善这种情况,我们可以选择引入一个随机量来破坏有序状态。
快速排序的随机化版本
我们可以通过在选择划分时随机选择一个主元来实现随机快速排序。仅需对上述代码做出小小的改动。
def Quick_Sort_Random(A,p,r):
if p<r:
q=Partition1(A,p,r)
Quick_Sort(A,p,q-1)
Quick_Sort(A,q,r)
def Partition1(A,p,r):
k=random.randint(p,r)
A[k],A[r]=A[r],A[k]
return Partition(A,p,r)
性能比较
是骡子是马我们拉出来溜溜,我对两种快排的性能做了一个简单的测试。首先是一定数量的随机序列,运行的时间单位为秒,下表中的结果是经多次运行所取得的平均值。
方法 | $10^3$ | $10^4$ | $10^5$ | $10^6$ | $10^7$ | 5*$10^7$ | $10^8$ |
---|---|---|---|---|---|---|---|
普通快排 | 0.00204557 | 0.02453995 | 0.32335813 | 4.83641084 | 63.91342704 | 456.20516078 | 1176.27041785 |
随机快排 | 0.00228848 | 0.03292949 | 0.39734049 | 5.41323487 | 66.26046769 | 451.38552999 | 1108.05737074 |
也可以使用可视化的方法将上表变得更加清楚,普通排序在数据量较小时具有一定的性能优势,随机快排可能是因为添加了随机选择这一项操作而影响了部分性能,但是随着数据量进一步增大,两者之间的性能会非常接近。
接下来是对有序序列进行测试,
方法 | $10^3$ | $10^4$ | $10^5$ | $10^6$ |
---|---|---|---|---|
普通快排 | 0.06262696 | / | / | / |
随机快排 | 0.03440228 | 0.45189877 | 7.28055120 | 95.54553382 |
普通快排在数据量非常小的时候就把栈给挤爆喽,从另一侧面反映出随机快排的必要性,在处理比较极端也就是完全有序的序列时具有较大的优势~
**粗体** _斜体_ [链接](http://example.com) `代码` - 列表 > 引用
。你还可以使用@
来通知其他用户。