spark error Caused by: java.io.NotSerializableException: org.apache.hadoop.hdfs.DistributedFileSystem


序列化問題多事rdd遍歷過程中使用了沒有序列化的對象。

1.將未序列化的變量定義到rdd遍歷內部。如定義入數據庫連接池。

 

 

 2.常量定義里包含了未序列化對象 ,提出去吧

如下常量要放到main里,不能放到rdd的遍歷中。

 val HBASE_TABLE = sparkModel.getUserParamsVal("hbbase_table", "default_table_name")

 


免責聲明!

本站轉載的文章為個人學習借鑒使用,本站對版權不負任何法律責任。如果侵犯了您的隱私權益,請聯系本站郵箱yoyou2525@163.com刪除。



 
粵ICP備18138465號   © 2018-2025 CODEPRJ.COM