Pandas—to_csv()寫入函數參數詳解


1. to_csv函數的參數

DataFrame.to_csv(path_or_buf=None, sep=',', na_rep='', float_format=None, columns=None, header=True, index=True, index_label=None, mode='w', encoding=None, compression='infer', quoting=None, quotechar='"', line_terminator=None, chunksize=None, date_format=None, doublequote=True, escapechar=None, decimal='.', errors='strict')

2. 參數解釋

參數名

參數類型

描述

path_or_buf

字符串或文件句柄

默認無文件路徑或對象,如果沒有提供,結果將返回為字符串。

sep

默認字符‘,’

輸出文件的字段分隔符。

na_rep

字符串,默認為 ‘’

缺失數據填充。

float_format

字符串,默認為 None

小數點保留幾位。

columns

序列,數組

可選列寫入,要寫入的字段列表。

header

字符串或布爾列表,默認為true

寫出列名。如果給定字符串列表,則作為列名的別名。

index

布爾值,默認為Ture

寫入行名稱(索引)。

index_label

字符串或序列,或False,默認為None

 如果需要,可以使用索引列的列標簽。如果沒有給出,且標題和索引為True,則使用索引名稱。如果數據文件使用多索引,則應該使用這個序列。如果值為False,不打印索引字段。在R中使用index_label=False 更容易導入索引.

mode

字符串,默認為"w"

Python寫模式,默認“w”。

r : 只能讀, 必須存在, 可在任意位置讀取

w : 只能寫, 可以不存在, 必會擦掉原有內容從頭寫

a : 只能寫, 可以不存在, 必不能修改原有內容, 只能在結尾追加寫, 文件指針無效

r+ : 可讀可寫, 必須存在, 可在任意位置讀寫, 讀與寫共用同一個指針

w+ : 可讀可寫, 可以不存在, 必會擦掉原有內容從頭寫

a+ : 可讀可寫, 可以不存在, 必不能修改原有內容, 只能在結尾追加寫, 文件指針只對讀有效 (寫操作會將文件指針移動到文件尾)

encoding

字符串,可選

編碼格式,表示在輸出文件中使用的編碼的字符串,Python2默認為“ASCII”,Python3默認為“UTF-8”。

compression

字符串,可選項

 表示在輸出文件中使用的壓縮的字符串,允許值為“gzip”、“bz2”、“xz”,僅在第一個參數是文件名時使用。

line_terminator

字符串,默認為 ‘\n’

在輸出文件中使用的換行字符或字符序列。默認為os.linesep,這取決於調用此方法的操作系統(例如,對於linux為“n”,對於Windows為“rn”)

quoting

CSV模塊的可選常量

默認值為to_csv.QUOTE_MINIMAL。如果設置了浮點格式,那么浮點將轉換為字符串,因此csv.QUOTE_NONNUMERIC會將它們視為非數值的。

quotechar

字符串(長度為1),默認“”

用於引用字段的字符

doublequote

布爾,默認為Ture

引用路徑在雙引號內

escapechar

字符串(長度為1),默認為None

在適當的時候用來轉義sep和quotechar的字符

chunksize

int或None

一次寫入行

date_format

字符串,默認為None

日期時間對象的格式字符串

decimal

字符串,默認’。’

識別為十進制分隔符的字符。歐洲數據使用 ​​’,’

errors

字符串。

指定如何處理編碼和解碼錯誤

 

 


免責聲明!

本站轉載的文章為個人學習借鑒使用,本站對版權不負任何法律責任。如果侵犯了您的隱私權益,請聯系本站郵箱yoyou2525@163.com刪除。



 
粵ICP備18138465號   © 2018-2025 CODEPRJ.COM