推荐系统技术文本相似性计算(三)实战篇

2016-05-31
阅读 8 分钟
12.9k
前两篇可以直接看我的专栏或者文本相似性计算(一)文本相似性计算(二)前面说了两篇了,分别介绍了TFIDF和向量空间的相关东西,然后介绍了主题模型,这一篇我们就来试试这两个东西。词向量就不在这篇试了,词向量和这两个关系不大,不好对比,不过我最后也给出了代码。

推荐系统技术 --- 文本相似性计算(二)

2016-05-29
阅读 4 分钟
6.2k
第一篇地址:[链接]上一篇中我们的小明已经中学毕业了,今天这一篇继续文本相似性的计算。首先前一篇不能解决的问题是因为我们只是机械的计算了词的向量,并没有任何上下文的关系,所以思想还停留在机器层面,还没有到更高的层次上来,正因为这样才有了自然语言处理这门课程了。