- 由於在做數據處理,數據分析的時候,免不了讀取數據或者將數據轉換為相應的處理形式,那么,pandas的read_excel() 和to_excel(),就能給我們很大的幫助,接下來,博主,將 read_excel() 和to_excel()兩個方法的定義,進行整合,方便大家進行查閱。
1. read_excel
read_excel方法定義:
pandas.read_excel(io, sheet_name=0, header=0, skiprows=None,
skip_footer=0, index_col=None, names=None, usecols=None,
parse_dates=False, date_parser=None, na_values=None,
thousands=None, convert_float=True, converters=None,
dtype=None, true_values=None, false_values=None,
engine=None, squeeze=False, **kwds)
io: 字符串,路徑對象(pathlib.Path或py._path.local.LocalPath)
文件類對象 ,pandas Excel 文件或 xlrd 工作簿。該字符串可能是一個URL。URL包括http,ftp,s3和文件。例如,本地文件可寫成file://localhost/path/to/workbook.xlsx
sheet_name :字符串,int,字符串/整數的混合列表或None,默認為0
表名用字符串表示,索引表位置用整數表示;字符串/整數列表用於請求多個表;沒有設置時將會自動獲取所有表;
可行的調用方式:
Defaults : 第一頁作為數據文件
1 :第二頁作為數據文件
“Sheet1” :第一頁作為數據文件
[0,1,“SEET5”] :第一、第二和第五作為作為數據文件
None :所有表為作為數據文件
sheetname : 字符串,int,字符串/整數的混合列表或None,默認為0
從版本 0.21.0:以后用 sheet_name 代替
header : 整型,或者整型列表,默認為0
行(0-索引)用於解析的DataFrame的列標簽。如果一個整數列表被傳遞,那么這些行位置將被合並成一個多索引。如果沒有標題,請使用None。
skiprows :類列表
開始時跳過的行(0索引)
skip_footer : 整型, 默認為 0
結束時的行(0-索引)
index_col : 整型, 整型列表, 默認 None
列(0索引)用作DataFrame的行標簽。 如果沒有這樣的列,則傳遞無。 如果傳遞一個列表,這些列將被組合成一個MultiIndex。 如果使用usecols選擇數據子集,則index_col基於該子集。
names : 類似數組,默認無
要使用的列名列表。如果文件沒有標題行,那么您應該顯式地通過header=None。
converters : 字典 , 默認 None
在某些列中轉換值的函數的命令。鍵可以是整數或列標簽,值是接受一個輸入參數的函數,Excel單元格內容,並返回轉換后的內容。
dtype : 類型名稱或dict的列-》其他類型,默認None
數據或列的數據類型。 例如。 {‘a’:np.float64,’b’:np.int32}使用對象保存Excel中存儲的數據,而不解釋dtype。 如果指定了轉換器,則將應用INSTEAD進行dtype轉換。
true_values : 列表, 默認 None
值視為Ture
0.19.0版中的新功能。
false_values : 列表, 默認 None
值視為False
0.19.0版中的新功能。
parse_cols : 整型或者列表, 默認為 None
自0.21.0版后不推薦使用:改為使用usecols。
usecols : 整型或者列表, 默認為 None
- 如果為None,則解析所有列,
- 如果為int,則某列將被解析
- 如果為ints,則列表要解析的列號列表將使用
- 如果為字符串表示逗號分隔的Excel列字母和列范圍列表(例如“A:E”或“A,C,E:F”)。 范圍包括邊界兩個。
squeeze : 布爾, 默認為 False
如果解析的數據只包含一列,則返回一個Series
na_values : 標量,字符串,列表類,或字典,默認None
某些字符串可以識別為 NA / NaN。 默認情況下,以下值將被解釋為NaN:
”,’#N / A’,’#N / AN / A’,’#NA’,’-1.#IND’,’1.#QNAN’, ‘-NNN’,
‘-nan’,’1.#IND’,’1.#QNAN’,’N/A’,’NA’,’NULL’,’NaN’,’n / a’,’nan ‘, ‘null’ 。
thousands : 字符串, 默認為 None
將字符串列解析為數字的數千個分隔符。請注意,此參數僅是在Excel中作為文本存儲的列所必需的,無論顯示格式如何,任何數字列都將自動解析。
keep_default_na : 布爾, 默認為True
如果指定了na_values,並且keep_default_na為False,那么默認的NaN值將被重寫
verbose :布爾, 默認為 False
顯示列表中除去數字列,NA值的數量
engine: 字符串, 默認為 None
如果io不是緩沖區或路徑,則必須將其設置為標識io。 可接受的值是None或xlrd
convert_float : 布爾, 默認為 True
將積分浮點數轉換為int(即1.0 - > 1)。 如果為False,則所有數字數據都將作為浮點數讀取:Excel將所有數字作為浮點數在內部存儲
2. to_excel
to_excel方法定義:
DataFrame.to_excel(excel_writer, sheet_name='Sheet1', na_rep='',
float_format=None, columns=None, header=True, index=True,
index_label=None, startrow=0, startcol=0, engine=None,
merge_cells=True, encoding=None, inf_rep='inf', verbose=True,
freeze_panes=None)
excel_writer : 字符串或ExcelWriter 對象
文件路徑或現有的ExcelWriter
sheet_name :字符串,默認“Sheet1”
將包含DataFrame的表的名稱。
na_rep : 字符串,默認‘ ’
缺失數據表示方式
float_format : 字符串,默認None
格式化浮點數的字符串
columns : 序列,可選
要編寫的列
header : 布爾或字符串列表,默認為Ture。
寫出列名。如果給定字符串列表,則假定它是列名稱的別名。
index :布爾,默認的Ture
寫行名(索引)
index_label : 字符串或序列,默認為None。
如果需要,可以使用索引列的列標簽。如果沒有給出,標題和索引為true,則使用索引名稱。如果數據文件使用多索引,則需使用序列。
startrow :
左上角的單元格行來轉儲數據框
startcol :
左上角的單元格列轉儲數據幀
engine : 字符串,默認沒有
使用寫引擎 - 您也可以通過選項io.excel.xlsx.writer,io.excel.xls.writer和io.excel.xlsm.writer進行設置。
merge_cells : 布爾,默認為Ture
編碼生成的excel文件。 只有xlwt需要,其他編寫者本地支持unicode。
inf_rep : 字符串,默認“正”
無窮大的表示(在Excel中不存在無窮大的本地表示)
freeze_panes : 整數的元組(長度2),默認為None。
指定要凍結的基於1的最底部行和最右邊的列