算法:按照标签相似度获取指定数量的其他值?

加入有一个游戏包含很多标签,这个时候有一个游戏推荐的栏目,其规则如下:

  1. 首先寻找标签完全一致的游戏,有4个就提取4个
  2. 不够4个就寻找标签有一个不同的游戏,
  3. 依次类推直到全不相同的游戏

好像有什么二进制运算啥的,但是搞不清楚。跪求大佬指引?

阅读 2.2k
2 个回答

假设你的一个游戏和标签是按照id绑定的,那么直接按照匹配个数排序就好了吧。二进制解决方案没想到

func findGame(labels [][]int, label []int){
   findSame := func(sli1, sli2 []int) (num int){
      for i := range sli1{
         for j := range sli2{
            if sli1[i] == sli2[j]{
               num ++
               break
            }
         }
      }
      return
   }
   sort.Slice(labels, func(i, j int) bool {
      return findSame(label, labels[i]) > findSame(label, labels[j])
   })
}

如果绑定的id还是有序的那么还能在寻找匹配个数时再优化

这个问题难度在于一般没有数据库支持这种功能,直接处理复杂度要逆天。

研究了一天,弄出来了,二进制版本:
将每一个tag保存在二进制的一位,比如:a->001, b->010, c->0100,然后也将每一个游戏的标签转换为二进制,比如有两个标签:011。通过定时任务去计算,只需要计算两个二进制就可以了,然后获取结果,最后汇聚再排序就好了。复杂度还是很高。

另一种方式是es,可以实时获取,想办法把权重重置为匹配到一个设为1就好了,然后权重排序尝试了半天才能es实现

撰写回答
你尚未登录,登录后可以
  • 和开发者交流问题的细节
  • 关注并接收问题和回答的更新提醒
  • 参与内容的编辑和改进,让解决方法与时俱进
推荐问题