rdd的元素打印

本文轉載自查看原文 2018-11-10 15:05 715

在集群上運行spark程序時，rdd的操作都在worker機上，因此輸出rdd的元素將在worker機的標准輸出上進行，驅動節點上不會運行，故直接才程序中寫如下代碼

rdd.foreach(println(_))

並不能產生期望的結果。此時應該先收集數據，再進行打印，即可得到預期結果

rdd.collect().foreach(println(_))

本站轉載的文章為個人學習借鑒使用，本站對版權不負任何法律責任。如果侵犯了您的隱私權益，請聯系本站郵箱yoyou2525@163.com刪除。

猜您在找 spark rdd元素println 什么是RDD？ Spark算子：統計RDD分區中的元素及數量 js打印指定元素內容【Python】打印列表所有元素打印web頁面中指定的DOM元素----table表格打印【python入門到放棄】字典元素的循環打印 c語言打印結構體元素 RDD操作 c++ 容器元素遍歷打印（for_each）