不多說,直接上干貨!
創建Pair RDD
Python語言
pairs = lines.map(lambda x: (x.split(" ")[0], x))
scala語言
val pairs = lines.map(x => (x.split(" ")(0), x))
Java語言
PairFunction keyData =
new PairFunction() {
public Tuple2 call(String x) {
return new Tuple2(x.split(" ")[0], x);
}
};
JavaPairRDD pairs = lines.mapToPair(keyData);
