scala lambda 表達式 & spark RDD函數操作

本文轉載自查看原文 2019-03-15 10:47 783 Spark 學習

形式：（參數）=> 表達式 [ 一種匿名函數 ]

例1：map（x => x._2）

　　解：x=輸入參數，“=>” 右邊是表達式（處理參數）；

　　　　 x._2 ： x變為（**，x，**...）元組的第二個元素；

　　　　 map （）：將每一條輸入參數映射為一個新的對象，在spark中會生成新的RDD，如下

　　　　flatmap （）對比

例2：filter（line=>line.split(",")=="Tom"）- 過濾

　　解：先 line.split（“,”）,將每一行按“，”拆分，再選擇其中==“Tom”的元素，形成新RDD

例3：val list=List(1,2,3,4) 

　　 list.reduce(_+_）

　　解： reduce（_+_）的下划線是占位符，表當前元素；

　　　　 reduce（）將對兩個元素操作返回一個元素

　　　　 reduceByKey（）

例4：collect（）

例5：foreach（）

其他RDD操作：

　　flatten
　　
　　zip

　　fold

　　groupByKey

　　patch

　　drop

　　sort

　　........

本站轉載的文章為個人學習借鑒使用，本站對版權不負任何法律責任。如果侵犯了您的隱私權益，請聯系本站郵箱yoyou2525@163.com刪除。

猜您在找 Lambda表達式對List的簡單操作 Python: 高階函數與lambda表達式委托、匿名函數、lambda表達式 Lambda表達式用法大比較: Scala和Java 8 lambda表達式操作map lambda表達式與回調函數 java箭頭函數，lambda表達式 JavaScript箭頭函數（Lambda表達式）用Lambda表達式操作List集合 Lambda表達式-聚合操作