CSV和EXCEL:
excel文件和 csv 文件的區別在於前者有分頁(sheet),而且用文檔編輯器打開的話會發現 excel 一行之間的單元格是以英文逗號 "," 結尾,而 csv 是以制表 “\t” 結尾。注意一點的是,並不是所有得到文件其內容都很規范,比如在一個單元格里面有一大段句子含有英文逗號,就會導致生成 DataFrame 出現問題。所以在導入 Python 中進行處理的時候有必要在 excel 中預查看一下。
import pandas as pd
def xlsx_to_csv_pd(): #讀取excel實例
data_xls = pd.read_excel("test.xlsx",index_col=0 ) data_xls.to_csv("test.csv",encoding="utf-8")
參數舉例:
def read_excel(io, sheet_name=0, header=0, skiprows=None, skip_footer=0, index_col=None, names=None, usecols=None, parse_dates=False, date_parser=None, na_values=None, thousands=None, convert_float=True, converters=None, dtype=None, true_values=None, false_values=None, engine=None, squeeze=False, **kwds):
部分參數說明:
io:讀取的文檔地質
sheet_name:讀取的指定sheet頁
header:設置讀取的excel第幾行是作為列名稱,默認值為 None
names:設置每列的名稱
index_col:設置第幾列是作為行名稱,,默認值為 None
usecols:執行需要讀取的數據列
參考文章: