pandas系列 read_excel() 和 to_excel()各參數詳解


  • 由於在做數據處理,數據分析的時候,免不了讀取數據或者將數據轉換為相應的處理形式,那么,pandas的read_excel() 和to_excel(),就能給我們很大的幫助,接下來,博主,將 read_excel() 和to_excel()兩個方法的定義,進行整合,方便大家進行查閱。

1. read_excel

read_excel方法定義:

pandas.read_excel(io, sheet_name=0, header=0, skiprows=None, 
skip_footer=0, index_col=None, names=None, usecols=None, 
parse_dates=False, date_parser=None, na_values=None, 
thousands=None, convert_float=True, converters=None, 
dtype=None, true_values=None, false_values=None, 
engine=None, squeeze=False, **kwds)

io: 字符串,路徑對象(pathlib.Path或py._path.local.LocalPath)

文件類對象 ,pandas Excel 文件或 xlrd 工作簿。該字符串可能是一個URL。URL包括http,ftp,s3和文件。例如,本地文件可寫成file://localhost/path/to/workbook.xlsx

sheet_name :字符串,int,字符串/整數的混合列表或None,默認為0

表名用字符串表示,索引表位置用整數表示;字符串/整數列表用於請求多個表;沒有設置時將會自動獲取所有表;
可行的調用方式:
Defaults : 第一頁作為數據文件
1 :第二頁作為數據文件
“Sheet1” :第一頁作為數據文件
[0,1,“SEET5”] :第一、第二和第五作為作為數據文件
None :所有表為作為數據文件

sheetname : 字符串,int,字符串/整數的混合列表或None,默認為0

從版本 0.21.0:以后用 sheet_name 代替

header : 整型,或者整型列表,默認為0

行(0-索引)用於解析的DataFrame的列標簽。如果一個整數列表被傳遞,那么這些行位置將被合並成一個多索引。如果沒有標題,請使用None。

skiprows :類列表

開始時跳過的行(0索引)

skip_footer : 整型, 默認為 0

結束時的行(0-索引)

index_col : 整型, 整型列表, 默認 None

列(0索引)用作DataFrame的行標簽。 如果沒有這樣的列,則傳遞無。 如果傳遞一個列表,這些列將被組合成一個MultiIndex。 如果使用usecols選擇數據子集,則index_col基於該子集。

names : 類似數組,默認無

要使用的列名列表。如果文件沒有標題行,那么您應該顯式地通過header=None。

converters : 字典 , 默認 None

在某些列中轉換值的函數的命令。鍵可以是整數或列標簽,值是接受一個輸入參數的函數,Excel單元格內容,並返回轉換后的內容。

dtype : 類型名稱或dict的列-》其他類型,默認None

數據或列的數據類型。 例如。 {‘a’:np.float64,’b’:np.int32}使用對象保存Excel中存儲的數據,而不解釋dtype。 如果指定了轉換器,則將應用INSTEAD進行dtype轉換。

true_values : 列表, 默認 None

值視為Ture
0.19.0版中的新功能。

false_values : 列表, 默認 None

值視為False
0.19.0版中的新功能。

parse_cols : 整型或者列表, 默認為 None

自0.21.0版后不推薦使用:改為使用usecols。

usecols : 整型或者列表, 默認為 None

  • 如果為None,則解析所有列,
  • 如果為int,則某列將被解析
  • 如果為ints,則列表要解析的列號列表將使用
  • 如果為字符串表示逗號分隔的Excel列字母和列范圍列表(例如“A:E”或“A,C,E:F”)。 范圍包括邊界兩個。

squeeze : 布爾, 默認為 False

如果解析的數據只包含一列,則返回一個Series

某些字符串可以識別為 NA / NaN。 默認情況下,以下值將被解釋為NaN:
”,’#N / A’,’#N / AN / A’,’#NA’,’-1.#IND’,’1.#QNAN’, ‘-NNN’,
‘-nan’,’1.#IND’,’1.#QNAN’,’N/A’,’NA’,’NULL’,’NaN’,’n / a’,’nan ‘, ‘null’ 。

thousands : 字符串, 默認為 None

將字符串列解析為數字的數千個分隔符。請注意,此參數僅是在Excel中作為文本存儲的列所必需的,無論顯示格式如何,任何數字列都將自動解析。

keep_default_na : 布爾, 默認為True

如果指定了na_values,並且keep_default_na為False,那么默認的NaN值將被重寫

verbose :布爾, 默認為 False

顯示列表中除去數字列,NA值的數量

engine: 字符串, 默認為 None

如果io不是緩沖區或路徑,則必須將其設置為標識io。 可接受的值是None或xlrd

convert_float : 布爾, 默認為 True

將積分浮點數轉換為int(即1.0 - > 1)。 如果為False,則所有數字數據都將作為浮點數讀取:Excel將所有數字作為浮點數在內部存儲

2. to_excel

to_excel方法定義:

DataFrame.to_excel(excel_writer, sheet_name='Sheet1', na_rep='',
 float_format=None, columns=None, header=True, index=True, 
 index_label=None, startrow=0, startcol=0, engine=None, 
 merge_cells=True, encoding=None, inf_rep='inf', verbose=True, 
 freeze_panes=None)

excel_writer : 字符串或ExcelWriter 對象

文件路徑或現有的ExcelWriter

sheet_name :字符串,默認“Sheet1”

將包含DataFrame的表的名稱。

na_rep : 字符串,默認‘ ’

缺失數據表示方式

float_format : 字符串,默認None

格式化浮點數的字符串

columns : 序列,可選

要編寫的列

header : 布爾或字符串列表,默認為Ture。

寫出列名。如果給定字符串列表,則假定它是列名稱的別名。

index :布爾,默認的Ture

寫行名(索引)

index_label : 字符串或序列,默認為None。

如果需要,可以使用索引列的列標簽。如果沒有給出,標題和索引為true,則使用索引名稱。如果數據文件使用多索引,則需使用序列。

startrow :

左上角的單元格行來轉儲數據框

startcol :

左上角的單元格列轉儲數據幀

engine : 字符串,默認沒有

使用寫引擎 - 您也可以通過選項io.excel.xlsx.writer,io.excel.xls.writer和io.excel.xlsm.writer進行設置。

merge_cells : 布爾,默認為Ture

編碼生成的excel文件。 只有xlwt需要,其他編寫者本地支持unicode。

inf_rep : 字符串,默認“正”

無窮大的表示(在Excel中不存在無窮大的本地表示)

freeze_panes : 整數的元組(長度2),默認為None。

指定要凍結的基於1的最底部行和最右邊的列


免責聲明!

本站轉載的文章為個人學習借鑒使用,本站對版權不負任何法律責任。如果侵犯了您的隱私權益,請聯系本站郵箱yoyou2525@163.com刪除。



 
粵ICP備18138465號   © 2018-2025 CODEPRJ.COM