像淘宝这种自动从评论里面获取变成标签的功能是如何实现的 有大神知道吗
楼上的各位大佬说的都对,不过其实还有一个更简单的方法,但是不够严谨,权当是多一个思路。
不用管那些关键词的匹配之类的,你只要在用户打分的时候,给每一个分值设定为对应的哪几个关键词
这样,就可以对应出不同的标签了。不过,真实需求中,你这样写,会被产品打死的...
1 回答4.2k 阅读✓ 已解决
2 回答2.3k 阅读✓ 已解决
2 回答871 阅读✓ 已解决
1 回答1.4k 阅读✓ 已解决
2 回答2.3k 阅读
1 回答722 阅读✓ 已解决
842 阅读
楼主这个问题就比较深了,牵涉到数据挖掘和自然语言处理等方面了。不是在sf几个demo代码就能给你解决的,不过可以提供一个思路给你。你自己搜搜相关资料仿一个就好了。
你可以看一下google的开源项目word2vec,这个可以用来做评论的挖掘然后做聚类分析。
那么,实现类似淘宝的这种聚类分析的效果怎么做呢?
收集所有评论,也就是获取你们自己的所有评论。
训练评论词向量,这里可以用斯坦福大学开源的CoreNLP来做中文分词,然后用google的word2vec来训练出词向量。
制定抽取规则,根据上面分析出的结果,制定出抽取的规则。
聚类去重,利用算法对抽取的候选标签去重
计算聚类中心,获得聚类最中心的标签作为显示的关键词。
另,在知乎有人对这个进行过讨论,你可以去参考一下。附上几个链接:
自然语言处理之Word2Vec
知乎关于评论标签聚类的讨论
用户评论挖掘