SegmentFault 热门内容优化

之前 SegmentFault 的热门内容算法没有考虑到时间因素，导致热门内容更新较慢，新的热门内容排不上位，所以最近对这块做了一些改动，主要参考了阮一峰老师的关于网站热门内容排序的一系列博客：

这几篇文章对于网站热门内容的计算研究有很好的指导作用，非常值得拜读。

言归正传，来说说 SegmentFault 的热门算法。

日/周/月热门如何区别？

首先要明确各类不同热门内容的目的。

日热门的主要目的就是突出最近一天内的热门内容，更方便于内容被大家看到，文章快速地形成讨论、受关注的问题尽快得到解决；
周热门的主要目的很明确，就是突出过去一周内的热门内容，同时，给新产生的优秀内容机会，让其有机会进入热门列表；
月热门同周热门目的一样，但更需要给新内容进入列表的机会，以让内容经常更新。

所以，该怎么做呢？

对于同一内容，上面的计算公式均可化简为

$$ \frac{s}{t^i} （s 是总得分指标，t 为时间量，i 是变量重力因子） $$

可以看出，其热度和创建时间成反比，那么这个反比的值最终就由重力因子 i 来影响。

日热门为了突出新热内容、过滤时间过久的热门内容，需要增大重力因子，尽可能排除 24 小时之外的热门内容；周热门和月热门则需要按时间要求依次逐渐降小 i 值。

关于指数 i 值的选定，采取了估算：绘制出一定范围内时间和文章热度的指数函数的图，然后根据需求挑选满足自己条件的指数值。如下图

图片描述

多次估值测试，最终分别将日、周、月的 i 值选取为 1.0、0.5、0.3。

总结

开始修改热门算法的时候，并没有收到计算周热门、月热门的需求，所以直接很暴力的将时间因子加入进去，这样的确能够满足需求，可以保证热门的内容随着时间的推移保持更新，而不会出现之前的某几篇文章的热度一直保持恒定，稳居榜首。

后来需要计算区间内的热门内容时，仍然使用开始的方案，因为时间因子的关系，会导致区间内的热门内容受时间的影响太大，出现的问题就是周热门、月热门榜首的内容依然是最新产生的内容占比重较多，所以才考虑对分母的时间因子做了动态调节的方案，也就是将分母的指数根据计算不同的区间，给出不同的值（但未找到更合适的取值方法，只能多次估值）。

我们目前的算法仍有需要完善之处，重力因子 i 的取值依旧是难点，大家如果有更好的方法，欢迎讨论。

SegmentFault 热门内容优化

热门文章

热门问答

日/周/月热门如何区别？

总结

NnNn

引用和评论

SegmentFault 技术周刊 Vol.21 - 程序人生（二）：2016 这一年

SegmentFault 思否 Top Writer 榜单｜2025 年第一季度

LRU算法，你别跑，我就要吃透你

【赞奇实测】DeepSeek 满血版 8卡 H20 141GB 并发压力测试，体验极致性能！

入选ICLR 2025，MIT/UC伯克利/哈佛/斯坦福等提出DRAKES算法，突破生物序列设计瓶颈

怎么判断自己下载的 trae 是国际版还是国内版？

30分钟内输出结果，新加坡国立大学/MIT等基于SVM构建微生物污染检测模型