當讀取進來的表格如圖所示,轉換成圖2。
import pandas as pd
# header:指定作為列名的行,默認0,即取第一行的值為列名。數據為列名行以下的數據;若數據不含列名,則設定 header = None。
data = pd.read_excel(r"D:\數據源.xls",header=4)
#skiprows:省略指定行數的數據,從第一行開始。
data = pd.read_excel(r"D:\數據源.xls",skiprows= 4)
如果用header 就能處理成想要的數據,就不用接下啦的步驟。
選取第一行所有數據,重置索引變成數據框,因為要用第一行所有數據作為列名。
以index為 key 剛剛第一行數據的值轉換為數據框之后columns 為0,0 列 為vlaue 字典
data_C = data.iloc[0, :].reset_index()
data_C = data_C.set_index('index').to_dict()[0]
將原來的表格重命名,以新構造的字典。刪除第一行數據,因為第一行數據要作為列名了。
此方法有個弊端就是,所有的數據類型都為object類型。
data = data.rename(columns=data_C).drop(0).reset_index(drop =True)