pandas系列 read_excel() 和 to_excel()各參數詳解

本文轉載自查看原文 2018-04-24 09:45 3500 Python基礎學習

由於在做數據處理，數據分析的時候，免不了讀取數據或者將數據轉換為相應的處理形式，那么，pandas的read_excel() 和to_excel()，就能給我們很大的幫助，接下來，博主，將 read_excel() 和to_excel()兩個方法的定義，進行整合，方便大家進行查閱。

1. read_excel

read_excel方法定義：

pandas.read_excel(io, sheet_name=0, header=0, skiprows=None, 
skip_footer=0, index_col=None, names=None, usecols=None, 
parse_dates=False, date_parser=None, na_values=None, 
thousands=None, convert_float=True, converters=None, 
dtype=None, true_values=None, false_values=None, 
engine=None, squeeze=False, **kwds)

io: 字符串，路徑對象（pathlib.Path或py._path.local.LocalPath）

文件類對象，pandas Excel 文件或 xlrd 工作簿。該字符串可能是一個URL。URL包括http，ftp，s3和文件。例如，本地文件可寫成file：//localhost/path/to/workbook.xlsx

sheet_name :字符串，int，字符串/整數的混合列表或None，默認為0

表名用字符串表示，索引表位置用整數表示；字符串/整數列表用於請求多個表；沒有設置時將會自動獲取所有表；
可行的調用方式：
Defaults ：第一頁作為數據文件
1 ：第二頁作為數據文件
“Sheet1” ：第一頁作為數據文件
[0,1，“SEET5”] ：第一、第二和第五作為作為數據文件
None ：所有表為作為數據文件

sheetname : 字符串，int，字符串/整數的混合列表或None，默認為0

從版本 0.21.0:以后用 sheet_name 代替

行(0-索引)用於解析的DataFrame的列標簽。如果一個整數列表被傳遞，那么這些行位置將被合並成一個多索引。如果沒有標題，請使用None。

skiprows :類列表

開始時跳過的行（0索引）

skip_footer : 整型, 默認為 0

結束時的行(0-索引)

index_col : 整型, 整型列表, 默認 None

列（0索引）用作DataFrame的行標簽。如果沒有這樣的列，則傳遞無。如果傳遞一個列表，這些列將被組合成一個MultiIndex。如果使用usecols選擇數據子集，則index_col基於該子集。

names : 類似數組，默認無

要使用的列名列表。如果文件沒有標題行，那么您應該顯式地通過header=None。

converters : 字典 , 默認 None

在某些列中轉換值的函數的命令。鍵可以是整數或列標簽，值是接受一個輸入參數的函數，Excel單元格內容，並返回轉換后的內容。

dtype : 類型名稱或dict的列-》其他類型,默認None

數據或列的數據類型。例如。 {‘a’：np.float64，’b’：np.int32}使用對象保存Excel中存儲的數據，而不解釋dtype。如果指定了轉換器，則將應用INSTEAD進行dtype轉換。

true_values : 列表, 默認 None

值視為Ture
0.19.0版中的新功能。

false_values : 列表, 默認 None

值視為False
0.19.0版中的新功能。

parse_cols : 整型或者列表, 默認為 None

自0.21.0版后不推薦使用：改為使用usecols。

usecols : 整型或者列表, 默認為 None

如果為None，則解析所有列，
如果為int，則某列將被解析
如果為ints，則列表要解析的列號列表將使用
如果為字符串表示逗號分隔的Excel列字母和列范圍列表（例如“A：E”或“A，C，E：F”）。范圍包括邊界兩個。

squeeze : 布爾, 默認為 False

如果解析的數據只包含一列，則返回一個Series

na_values : 標量，字符串，列表類，或字典，默認None

某些字符串可以識別為 NA / NaN。默認情況下，以下值將被解釋為NaN：
”，’＃N / A’，’＃N / AN / A’，’#NA’，’-1.＃IND’，’1.＃QNAN’， ‘-NNN’，
‘-nan’，’1.＃IND’，’1.＃QNAN’，’N/A’，’NA’，’NULL’，’NaN’，’n / a’，’nan ‘， ‘null’ 。

thousands : 字符串, 默認為 None

將字符串列解析為數字的數千個分隔符。請注意，此參數僅是在Excel中作為文本存儲的列所必需的，無論顯示格式如何，任何數字列都將自動解析。

keep_default_na : 布爾, 默認為True

如果指定了na_values，並且keep_default_na為False，那么默認的NaN值將被重寫

verbose :布爾, 默認為 False

顯示列表中除去數字列，NA值的數量

engine: 字符串, 默認為 None

如果io不是緩沖區或路徑，則必須將其設置為標識io。可接受的值是None或xlrd

convert_float : 布爾, 默認為 True

將積分浮點數轉換為int（即1.0 - > 1）。如果為False，則所有數字數據都將作為浮點數讀取：Excel將所有數字作為浮點數在內部存儲

2. to_excel

to_excel方法定義：

DataFrame.to_excel(excel_writer, sheet_name='Sheet1', na_rep='',
 float_format=None, columns=None, header=True, index=True, 
 index_label=None, startrow=0, startcol=0, engine=None, 
 merge_cells=True, encoding=None, inf_rep='inf', verbose=True, 
 freeze_panes=None)

excel_writer : 字符串或ExcelWriter 對象

文件路徑或現有的ExcelWriter

sheet_name :字符串,默認“Sheet1”

將包含DataFrame的表的名稱。

na_rep : 字符串,默認‘ ’

缺失數據表示方式

float_format : 字符串,默認None

格式化浮點數的字符串

columns : 序列,可選

要編寫的列

寫出列名。如果給定字符串列表，則假定它是列名稱的別名。

index :布爾,默認的Ture

寫行名（索引）

index_label : 字符串或序列，默認為None。

如果需要，可以使用索引列的列標簽。如果沒有給出，標題和索引為true，則使用索引名稱。如果數據文件使用多索引，則需使用序列。

startrow :

左上角的單元格行來轉儲數據框

startcol :

左上角的單元格列轉儲數據幀

engine : 字符串,默認沒有

使用寫引擎 - 您也可以通過選項io.excel.xlsx.writer，io.excel.xls.writer和io.excel.xlsm.writer進行設置。

merge_cells : 布爾,默認為Ture

編碼生成的excel文件。只有xlwt需要，其他編寫者本地支持unicode。

inf_rep : 字符串,默認“正”

無窮大的表示(在Excel中不存在無窮大的本地表示)

freeze_panes : 整數的元組(長度2)，默認為None。

指定要凍結的基於1的最底部行和最右邊的列

免責聲明！

本站轉載的文章為個人學習借鑒使用，本站對版權不負任何法律責任。如果侵犯了您的隱私權益，請聯系本站郵箱yoyou2525@163.com刪除。

猜您在找 Python：pandas（一）——常用、讀寫函數read_csv、read_excel、to_csv、to_excel pandas read_excel 產生 Unnamed:0 列 module 'pandas' has no attribute 'read_excel' pandas to_excel 用法詳解 pandas的read_excel需要絕對路徑 pandas to_excel pandas to_excel 添加顏色 could not find function "read_excel" python pandas to_excel 高級玩法 pandas.read_csv參數詳解