与时间相关的的分算法

在像SF这种问答网站里,热门排序里是否也考虑了时间因素?就是时间越久,权值越低,我觉得这个因素是非常必要的,在考虑浏览量,答案数,vote up的同时,也兼顾问题时效性。
我做排序也遇到这个问题,通过以上提到的各种因素排序,但是问题在于如果使用计算总分的方式,就需要不断的把当前时间作为因子,重新计算全部数据的分值,以保证时效。这样就需要多次遍历全部数据。
我希望有一种方法,在不更新旧数据的情况下,直接在查询过程中给新问题加权,有什么思路可以实现呢?

阅读 4.8k
3 个回答

运动员的世界排名,是按比赛分来排列的,比如:今年的分数全算,去年的算一半(各个协会不同,假设一半),前年的算1/3,大前年1/5,再之前的不算.

他们并不是每次比赛以后算一次,而是每次比赛后加上这次的分数,然后到赛季重算一次, 记住赛级开始时的分数,然后后面再累加.

你也可以用这个思路,分时间段(赛季),比如每个月算一次,得到的结果存起来,然后后面的分值就累积再这个上面,到下个时间节点再计算一次. 这是一种比较好的平衡,运算量也不多,而且不修改老数据.只是每个时间节点加权算一次

以你的程序开始上线运行开始算起,假设为今天的0点为例2012-12-26 00:00:00,
你在存储数据的时候,再加一列,类型为long,值为最新时间与初始时间的总毫秒差。
然后根据你的程序时效性要求,设定一个系数以调整时间在总分中的比重。
详细可以参考http://www.ruanyifeng.com/blog/2012/0...

新手上路,请多包涵

将时间戳除以某个常数(如:100000),得到类似13.153,13.226之类的「时间因子」,这样越是新的内容,时间因子就越大,自然权重也就越高。

撰写回答
你尚未登录,登录后可以
  • 和开发者交流问题的细节
  • 关注并接收问题和回答的更新提醒
  • 参与内容的编辑和改进,让解决方法与时俱进
推荐问题