除了使用xlrd庫或者xlwt庫進行對excel表格的操作讀與寫,而且pandas庫同樣支持excel的操作;且pandas操作更加簡介方便。
首先是pd.read_excel的參數:函數為:
表格數據:
常用參數解析:
- io :excel 路徑;
- sheetname:默認是sheetname為0,返回多表使用sheetname=[0,1],若sheetname=None是返回全表 。注意:int/string返回的是dataframe,而none和list返回的是dict of dataframe。
- header :指定作為列名的行,默認0,即取第一行,數據為列名行以下的數據;商務英語前景若數據不含列名,則設定 header=None;
- skiprows:省略指定行數的數據
- skip_footer:省略從尾部數的行數據
- index_col :指定列為索引列,也可以使用 u’string’
- names:指定列的名字,傳入一個list數據
總體而言,pandas庫的pd.read_excel和pd.read_csv的參數比較類似,且相較之前的xlrd庫的讀表操作更加簡單,針對一般批量的數據處理最好選擇pandas庫操作。但是功能有待完善或者本次研究的不夠深入,比如合並單元格的問題,歡迎一起討論交流。