除了使用xlrd庫或者xlwt庫進行對excel表格的操作讀與寫,而且pandas庫同樣支持excel的操作;且pandas操作更加簡介方便。
首先是pd.read_excel的參數:函數為:
def read_excel(io, sheet_name=0, header=0, skiprows=None,skip_footer=0, index_col=None, names=None, usecols=None, parse_dates=False, date_parser=None, na_values=None, thousands=None, convert_float=True, converters=None, dtype=None, true_values=None, false_values=None, engine=None, squeeze=False, **kwds)
表格數據:
常用參數解析:
- io :excel 路徑;
- sheetname:默認是sheetname為0,返回多表使用sheetname=[0,1],若sheetname=None是返回全表 。注意:int/string返回的是dataframe,而none和list返回的是dict of dataframe。
- header :指定作為列名的行,默認0,即取第一行,數據為列名行以下的數據;若數據不含列名,則設定 header = None;
- skiprows:省略指定行數的數據
- skip_footer:省略從尾部數的行數據
- index_col :指定列為索引列,也可以使用 u’string’
- names:指定列的名字,傳入一個list數據
- 總體而言,pandas庫的pd.read_excel和pd.read_csv的參數比較類似,且相較之前的xlrd庫的讀表操作更加簡單,針對一般批量的數據處理最好選擇pandas庫操作。但是功能有待完善或者本次研究的不夠深入,比如合並單元格的問題,歡迎一起討論交流。
根據https://blog.csdn.net/qq_38486203/article/details/80597738轉發