淘宝用户评价标签如何实现

clipboard.png

像淘宝这种自动从评论里面获取变成标签的功能是如何实现的 有大神知道吗

阅读 7.7k
6 个回答

楼主这个问题就比较深了,牵涉到数据挖掘和自然语言处理等方面了。不是在sf几个demo代码就能给你解决的,不过可以提供一个思路给你。你自己搜搜相关资料仿一个就好了。
你可以看一下google的开源项目word2vec,这个可以用来做评论的挖掘然后做聚类分析。
那么,实现类似淘宝的这种聚类分析的效果怎么做呢?

  1. 收集所有评论,也就是获取你们自己的所有评论。

  2. 训练评论词向量,这里可以用斯坦福大学开源的CoreNLP来做中文分词,然后用google的word2vec来训练出词向量。

  3. 制定抽取规则,根据上面分析出的结果,制定出抽取的规则。

  4. 聚类去重,利用算法对抽取的候选标签去重

  5. 计算聚类中心,获得聚类最中心的标签作为显示的关键词。

另,在知乎有人对这个进行过讨论,你可以去参考一下。附上几个链接:
自然语言处理之Word2Vec
知乎关于评论标签聚类的讨论
用户评论挖掘

很简单啊,统计了频繁的关键字而已

有可能是关键字索引,也有可能是评价的时候打钩,感觉更像是关键字匹配出来的

分词, 统计出现词的次数, 设置如出现100次以上就可以形成一个标签.

楼上的各位大佬说的都对,不过其实还有一个更简单的方法,但是不够严谨,权当是多一个思路。
不用管那些关键词的匹配之类的,你只要在用户打分的时候,给每一个分值设定为对应的哪几个关键词
这样,就可以对应出不同的标签了。不过,真实需求中,你这样写,会被产品打死的...

撰写回答
你尚未登录,登录后可以
  • 和开发者交流问题的细节
  • 关注并接收问题和回答的更新提醒
  • 参与内容的编辑和改进,让解决方法与时俱进
推荐问题