python讀取EXCEL是去掉空白行和表頭全部重命名


當讀取進來的表格如圖所示,轉換成圖2。

 

 

 

 import pandas as pd

# header:指定作為列名的行,默認0,即取第一行的值為列名。數據為列名行以下的數據;若數據不含列名,則設定 header = None。

data = pd.read_excel(r"D:\數據源.xls",header=4)

#skiprows:省略指定行數的數據,從第一行開始。

data = pd.read_excel(r"D:\數據源.xls",skiprows= 4)

如果用header 就能處理成想要的數據,就不用接下啦的步驟。

選取第一行所有數據,重置索引變成數據框,因為要用第一行所有數據作為列名。

以index為 key 剛剛第一行數據的值轉換為數據框之后columns 為0,0 列 為vlaue 字典

data_C = data.iloc[0, :].reset_index()

data_C = data_C.set_index('index').to_dict()[0]

將原來的表格重命名,以新構造的字典。刪除第一行數據,因為第一行數據要作為列名了。

此方法有個弊端就是,所有的數據類型都為object類型。

data = data.rename(columns=data_C).drop(0).reset_index(drop =True)

 

 


免責聲明!

本站轉載的文章為個人學習借鑒使用,本站對版權不負任何法律責任。如果侵犯了您的隱私權益,請聯系本站郵箱yoyou2525@163.com刪除。



 
粵ICP備18138465號   © 2018-2025 CODEPRJ.COM