一个rdd是包含id和向量的列表现在需要将其中的每一项分别和余下的项计算也就是做一个余弦相似度运算但是rdd又不能互相嵌套比如: vectorRDD.foreach(v1=>{ vectorRDD.foreach(v2=>{ println(cosDistance(v1._2,v2._2)) }) })是不行的如何做呢?
已解决:
先用
collect
把RDD
转为Array
再用
for
循环嵌套一下