最近在学习基于物品的协同过滤的推荐算法,是基于评分预测的,数据用了movielens,发现大部分网上的实现都划分了测试集和训练集,我目前的理解是这样的
1.把所有user-movie-rate划分测试集和训练集
2.使用训练集计算物品相似矩阵
3.使用该相似矩阵给测试集中的user-movie项目预测评分,并与测试集中的真实评分比较,评估算法指标(RMSE,MSE等)
首先不知道以上理解有没有错误?
其次,如果要应用到实际推荐中,也就是要给所有user-movie都预测评分,是不是直接使用训练集得出的相似度矩阵来预测整个数据集即可? 测试集是否仅仅是为了评估算法性能的呢