map和FlatMap之間區別?
這兩者都是遍歷RDD中數據,並對數據進行數據操作,並且會的到一個全新RDD
Map多用於計算或處理一些特殊數據類型,不能使用扁平化處理的數據類型
flatMap不僅可以對數據遍歷處理,而且可以將存在RDD中集合中數據進行處理並且存儲到一個新的集合中
所以兩種的使用本質上沒有區別,但flatMap比Map多出了對集合數據壓平的作用
ps:一般情況下在Spark開發中較多使用flatMap,但是 flatMap不能使用所有的場景,所以也會使用map來進行處理數據