我这样写:val validRDD = unionRDD.map(item => { val arr = item.split(' ') ((arr(1), arr(2)), arr(3).toDouble) }) .distinct()unionRDD中是用空格隔开的数据先转成一个二元tuple但是distinct似乎不能对元组去重结果还是有重复的,如下:(这是打印的validRDD)如何解决?
你看看呢:val unionRDD = Array(" 1 1 3.0"," 1 1 3.0"," 1 1 3.0"); val validRDD = unionRDD.map(item => { val arr = item.split(' ') ((arr(1), arr(2)), arr(3).toDouble) }).distinct println(validRDD.toList);希望能帮助到你。
你看看呢:
希望能帮助到你。