map():每次處理一條數據
mapPartition():每次處理一個分區的數據,這個分區的數據處理完后,原RDD中分區的數據才能釋放,可能導致OOM
當內存空間較大的時候建議使用mapPartition(),以提高處理效率
map():每次處理一條數據
mapPartition():每次處理一個分區的數據,這個分區的數據處理完后,原RDD中分區的數據才能釋放,可能導致OOM
當內存空間較大的時候建議使用mapPartition(),以提高處理效率
本站轉載的文章為個人學習借鑒使用,本站對版權不負任何法律責任。如果侵犯了您的隱私權益,請聯系本站郵箱yoyou2525@163.com刪除。