我这样写:
val validRDD = unionRDD.map(item => {
val arr = item.split(' ')
((arr(1), arr(2)), arr(3).toDouble)
})
.distinct()
unionRDD中是用空格隔开的数据
先转成一个二元tuple
但是distinct似乎不能对元组去重
结果还是有重复的,如下:(这是打印的validRDD)
如何解决?
我这样写:
val validRDD = unionRDD.map(item => {
val arr = item.split(' ')
((arr(1), arr(2)), arr(3).toDouble)
})
.distinct()
unionRDD中是用空格隔开的数据
先转成一个二元tuple
但是distinct似乎不能对元组去重
结果还是有重复的,如下:(这是打印的validRDD)
如何解决?
15 回答8.4k 阅读
4 回答4.4k 阅读✓ 已解决
4 回答4k 阅读
1 回答3k 阅读✓ 已解决
3 回答2.1k 阅读✓ 已解决
2 回答1.5k 阅读✓ 已解决
4 回答2.3k 阅读✓ 已解决
你看看呢:
希望能帮助到你。