python读取EXCEL是去掉空白行和表头全部重命名


当读取进来的表格如图所示,转换成图2。

 

 

 

 import pandas as pd

# header:指定作为列名的行,默认0,即取第一行的值为列名。数据为列名行以下的数据;若数据不含列名,则设定 header = None。

data = pd.read_excel(r"D:\数据源.xls",header=4)

#skiprows:省略指定行数的数据,从第一行开始。

data = pd.read_excel(r"D:\数据源.xls",skiprows= 4)

如果用header 就能处理成想要的数据,就不用接下啦的步骤。

选取第一行所有数据,重置索引变成数据框,因为要用第一行所有数据作为列名。

以index为 key 刚刚第一行数据的值转换为数据框之后columns 为0,0 列 为vlaue 字典

data_C = data.iloc[0, :].reset_index()

data_C = data_C.set_index('index').to_dict()[0]

将原来的表格重命名,以新构造的字典。删除第一行数据,因为第一行数据要作为列名了。

此方法有个弊端就是,所有的数据类型都为object类型。

data = data.rename(columns=data_C).drop(0).reset_index(drop =True)

 

 


免责声明!

本站转载的文章为个人学习借鉴使用,本站对版权不负任何法律责任。如果侵犯了您的隐私权益,请联系本站邮箱yoyou2525@163.com删除。



 
粤ICP备18138465号  © 2018-2025 CODEPRJ.COM