Partition只是一个抽象的数据集。实际数据存储在Block上,Block存储方式、副本数由persist(StorageLevel)决定。目前Spark默认使用的分区器是org.apache.spark.RangePartitioner。
Partition只是一个抽象的数据集。实际数据存储在Block上,Block存储方式、副本数由persist(StorageLevel)决定。目前Spark默认使用的分区器是org.apache.spark.RangePartitioner。