spark 寫csv文件出現亂碼以及寫文件讀文件總結

本文轉載自查看原文 2021-09-03 16:36 100 spark

參考鏈接：https://blog.csdn.net/qq_56870570/article/details/118492373

result_with_newipad.write.mode("Append").csv("C:\\Users")

數據格式如下：

但在寫文件時最后一列address報的是亂碼

具體方式可以在寫csv下寫option添加utf-8格式

result_with_newipad.writer.mode("overwrite").option("header","ture").option("encoding","utf-8").csv("")

關鍵參數：

format：指定讀取csv文件。

header：是否指定頭部行作為schema。

multiLine：在單元格中可能因為字數多有換行，但是不指定這個參數，處理數據時可能會報錯。指定這個參數為true，可以將換行的單元格合並為1行。

encoding：指定編碼格式如gbk或utf-8

如下表對option里面的參數，進行介紹：

參數	解釋
header	默認是`false`，將第一行作為列名
encoding	默認是uft-8通過給定的編碼類型進行解碼
sep	默認是`,` 指定單個字符分割字段和值
inferSchema	inferSchema`（默認為`false`）：從數據自動推斷輸入模式。 *需要對數據進行一次額外的傳遞
multiLine	默認是`false`,解析一條記錄，該記錄可能跨越多行
inferSchema	inferSchema`（默認為`false`）：從數據自動推斷輸入模式。 *需要對數據進行一次額外的傳遞。如：option("inferSchema", true.toString) //這是自動推斷屬性列的數據類型
nullValue	默認是空的字符串,設置null值的字符串表示形式。從2.0.1開始，這適用於所有支持的類型，包括字符串類型
emptyValue	默認是空字符串,設置一個空值的字符串表示形式

本站轉載的文章為個人學習借鑒使用，本站對版權不負任何法律責任。如果侵犯了您的隱私權益，請聯系本站郵箱yoyou2525@163.com刪除。

猜您在找 讀CSV文件並寫arcgis shp文件 spark讀文件寫mysql(java版) scala 寫csv文件 golang——寫文件和讀文件 JavaCSV之寫CSV文件 QT 寫csv文件 Python 讀、寫、追加csv文件詳細以及注意事項 python筆記5-python2寫csv文件中文亂碼問題 Python在向CSV文件寫中文時亂碼的處理辦法 MySQL注入利用系統讀、寫文件