Spark RDD詳解 | RDD特性、lineage、緩存、checkpoint、依賴關系
RDD(Resilient Distributed Datasets)彈性的分布式數據集,又稱Spark core,它代表一個只讀的、不可變、可分區,里面的元素可分布式並行計算的數據集。 RDD是一 ...
RDD(Resilient Distributed Datasets)彈性的分布式數據集,又稱Spark core,它代表一個只讀的、不可變、可分區,里面的元素可分布式並行計算的數據集。 RDD是一 ...