SPARK之map()和mapPartition()的區別


  • map():每次處理一條數據

  • mapPartition():每次處理一個分區的數據,這個分區的數據處理完后,原RDD中分區的數據才能釋放,可能導致OOM

    當內存空間較大的時候建議使用mapPartition(),以提高處理效率


  • 免責聲明!

    本站轉載的文章為個人學習借鑒使用,本站對版權不負任何法律責任。如果侵犯了您的隱私權益,請聯系本站郵箱yoyou2525@163.com刪除。



     
    粵ICP備18138465號   © 2018-2025 CODEPRJ.COM