为什么Spark只会惰性计算RDD?为什么只有第一次在一个行动操作中用到时,才会真正计算?
计算资源那么宝贵,为什么要做无用的计算?
不仅计算资源宝贵,个人觉得更为重要的是spark有一个pipeline和DAG的概念。
1 回答841 阅读✓ 已解决
1 回答717 阅读✓ 已解决
1 回答2.3k 阅读
1 回答3.6k 阅读
1 回答6.2k 阅读
1 回答2.3k 阅读✓ 已解决
5.4k 阅读
计算资源那么宝贵,为什么要做无用的计算?