不多說,直接上干貨!
創建Pair RDD
Python語言
pairs = lines.map(lambda x: (x.split(" ")[0], x))
scala語言
val pairs = lines.map(x => (x.split(" ")(0), x))
Java語言
PairFunction keyData = new PairFunction() { public Tuple2 call(String x) { return new Tuple2(x.split(" ")[0], x); } }; JavaPairRDD pairs = lines.mapToPair(keyData);