【国外文章】关于国外博主attractivechaos的基数排序radix的升级版本的代码注释

原文地址。通过作者的修改，排序速度确实非常快。是一种建立在底层优化上的排序方法。主要的做法是将排序的数字变成二进制，并且安放了256个桶。作者也将这种算法写到了他的开源作品klib（一个c语言的标准库）中。github地址。

我业余时间一边找资料，一边翻译代码，前后大概用了半个月的时间。所以喜欢的朋友就收藏一下吧 ^_^

一作者的话

当我写的代码的排序速度遇到瓶颈了，我参考了这篇文章，之后的速度比我原来的一个版本是约40%。比STL的std::sort快2.5倍。对大整数数组排序,基数排序才是效率杠杠的。它比其他标准算法快得多也简单的多。

二代码的注释和解读

1. 代码主要部分贴图

// sort between [$beg, $end); take radix from ">>$s&((1<<$n_bits)-1)"
void rs_sort(rstype_t *beg, rstype_t *end, int n_bits, int s)
{
  rstype_t *i;
  int size = 1<<n_bits, m = size - 1;
  rsbucket_t *k, b[size], *be = b + size; // b[] keeps all the buckets
 
  for (k = b; k != be; ++k) k->b = k->e = beg;
  for (i = beg; i != end; ++i) ++b[rskey(*i)>>s&m].e; // count radix
  for (k = b + 1; k != be; ++k) // set start and end of each bucket
    k->e += (k-1)->e - beg, k->b = (k-1)->e;
  for (k = b; k != be;) { // in-place classification based on radix
    if (k->b != k->e) { // the bucket is not full
      rsbucket_t *l;
      if ((l = b + (rskey(*k->b)>>s&m)) != k) { // different bucket
        rstype_t tmp = *k->b, swap;
        do { // swap until we find an element in bucket $k
          swap = tmp; tmp = *l->b; *l->b++ = swap;
          l = b + (rskey(tmp)>>s&m);
        } while (l != k);
        *k->b++ = tmp; // push the found element to $k
      } else ++k->b; // move to the next element in the bucket
    } else ++k; // move to the next bucket
  }
  for (b->b = beg, k = b + 1; k != be; ++k) k->b = (k-1)->e; // reset k->b
  if (s) { // if $s is non-zero, we need to sort buckets
    s = s > n_bits? s - n_bits : 0;
    for (k = b; k != be; ++k)
      if (k->e - k->b > RS_MIN_SIZE) rs_sort(k->b, k->e, n_bits, s);
      else if (k->e - k->b > 1) rs_insertsort(k->b, k->e);
  }
}

通过分析代码我们就能看出，rs_sort递归遍历直到s==0的时候为止。

桶排序才去的是十进制，换句话说就是放十个桶，但是作者根据cpu底层结构将数字转换成了256进制，换句话说，他一共要放256个桶。

2. 代码逐行解析注释

// sort between [$beg, $end); take radix from ">>$s&((1<<$n_bits)-1)"

1.第一行的注释, 对起始地址是$beg和$end的数组进行排序。基数选择的是当前数字右移s位与（运算）2的n次方-1

for (k = b; k != be; ++k) k->b = k->e = beg;

2.通过循环，将每个桶的beg指针指向待排序数组的第一个数字的地址(即beg)

for (i = beg; i != end; ++i) ++b[rskey(*i)>>s&m].e;

3.作者在这里将数字变成了256进制，通过将该数字右移s位&m的方式，来获取这个数字右移s位后的值（如果右移之后发现变成了0 那么就是0），并将相对应序号的桶的储存量加一。例如获取该数字右移s位后的值是132，那么就将132号桶的存储量加一。

这么做的目的在于采取由高向低遍历的方式，先将数字转化成256进制，然后获取这个数字的右移s位的值。并放入桶中。

用十进制举例子，这样相当于十进制中，我们先获取万位的数字，分别将他们放在1-10的木桶中，再获取千位依次放入，然后获取百位，十位，个位。

for (k = b + 1; k != be; ++k) // set start and end of each bucket
    k->e += (k-1)->e - beg, k->b = (k-1)->e;

4.每个木桶里面装几个都已经做好了，但是每个木桶的起始位置都是指向的beg，现在需要将他们连起来，b[x+1]的起始指针指向b[x]的结束指针。

5.排序开始了啊敲黑板！！！ 。因为上一步里面只是将相对应的桶的存储量+1 还没有进行排序！！！所以在这里就要开始排序了！！！。

for (k = b; k != be;) { // 开始循环木桶
    if (k->b != k->e) { // 如果这个木桶不是空的，或者木桶里面的数字还没有完成遍历
      rsbucket_t *l;
      if ((l = b + (rskey(*k->b)>>s&m)) != k) { // 不同的桶进行交换
        rstype_t tmp = *k->b, swap;
        do { // 循环 直到我们找到这个桶里面应该存储的数字
          swap = tmp; tmp = *l->b; *l->b++ = swap;
          l = b + (rskey(tmp)>>s&m);
        } while (l != k);
        *k->b++ = tmp; // 将数字放到桶里面
      } else ++k->b; // 移动到桶里面的下一个元素
    } else ++k; // 移动到下一个桶
  }

3. 总结

模拟了一下100万条数据进行排序，发现速度确实比其他的排序速度快大概可以达到作者说的2.5倍。平时市面上的radix排序都是用的十进制，大都是实现了算法但是排序速度确实不够快。

【国外文章】关于国外博主attractivechaos的基数排序radix的升级版本的代码注释

一作者的话

二代码的注释和解读

1. 代码主要部分贴图

桶排序才去的是十进制，换句话说就是放十个桶，但是作者根据cpu底层结构将数字转换成了256进制，换句话说，他一共要放256个桶。

2. 代码逐行解析注释

这么做的目的在于采取由高向低遍历的方式，先将数字转化成256进制，然后获取这个数字的右移s位的值。并放入桶中。

用十进制举例子，这样相当于十进制中，我们先获取万位的数字，分别将他们放在1-10的木桶中，再获取千位依次放入，然后获取百位，十位，个位。

3. 总结

如果还有什么问题欢迎大家留言。

和平老三

引用和评论

缓存更新的套路

Visual Studio Code (VS Code) – C/C++ 入门

入选ICLR 2025，MIT/UC伯克利/哈佛/斯坦福等提出DRAKES算法，突破生物序列设计瓶颈

30分钟内输出结果，新加坡国立大学/MIT等基于SVM构建微生物污染检测模型

怎么判断自己下载的 trae 是国际版还是国内版？

如何系统地入门学习stm32？

vLLM 实战教程汇总，从环境配置到大模型部署，中文文档追踪重磅更新

【国外文章】关于国外博主attractivechaos的基数排序radix的升级版本的代码注释

一 作者的话

二 代码的注释和解读

1. 代码主要部分贴图

桶排序才去的是十进制，换句话说就是放十个桶，但是作者根据cpu底层结构将数字转换成了256进制，换句话说，他一共要放256个桶。

2. 代码逐行解析注释

这么做的目的在于 采取由高向低遍历的方式，先将数字转化成256进制，然后获取这个数字的右移s位的值。并放入桶中。

用十进制举例子，这样相当于十进制中，我们先获取万位的数字，分别将他们放在1-10的木桶中，再获取千位依次放入，然后获取百位，十位，个位。

3. 总结

如果还有什么问题 欢迎大家留言。

和平老三

引用和评论

缓存更新的套路

Visual Studio Code (VS Code) – C/C++ 入门

入选ICLR 2025，MIT/UC伯克利/哈佛/斯坦福等提出DRAKES算法，突破生物序列设计瓶颈

30分钟内输出结果，新加坡国立大学/MIT等基于SVM构建微生物污染检测模型

怎么判断自己下载的 trae 是国际版还是国内版？

如何系统地入门学习stm32？

vLLM 实战教程汇总，从环境配置到大模型部署，中文文档追踪重磅更新

一作者的话

二代码的注释和解读

这么做的目的在于采取由高向低遍历的方式，先将数字转化成256进制，然后获取这个数字的右移s位的值。并放入桶中。

如果还有什么问题欢迎大家留言。