Pandas DataFrame的基本属性


DataFrame的基础功能,以后要查询就得看这里!

功能清单

df2.index df2.columns df2.axes df2.T df2.info() df2.head(i) df2.tail(i) df2.describe()

 

首先随机创建一个DataFrame

# 利用 numpy 的随机函数建立一个 DataFrame
df = DataFrame(np.random.rand(50,5))

运行结果

是5行50列的一个二维数组

5行50列的二维数组

 这里为了加深印象,我添加了一个字典,增加对比,如下

data = {'state':['Ohino','Ohino','Ohino','Nevada','Nevada'],
        'year':[2000,2001,2002,2001,2002],
        'pop':[1.5,1.7,3.6,2.4,2.9]}
dic_df = DataFrame(data,index=['one','two','three','four','five'],
               columns=['year','state','pop','debt'])
print(df)

运行结果

 

 重点来了,以后查的时候就用下边

df.index 

求行

df.index
dic_df.index

df运行结果

RangeIndex(start=0, stop=50, step=1)
#意思是从0开始,50结束,步长为1

 dic_df的运行结果

Index(['one', 'two', 'three', 'four', 'five'], dtype='object')

df.columns
求列
print(df.columns)
print(dic_df.columns)

运行结果

 

 df.axes

print(df.axes)
print(dic_df.axes)

运行结果

就是返回两个“边”。

 

df.T

index 跟 columns 对调

 

print(dic_df)
print(dic_df.T)

运行结果

 

df.info()
打印二维数组的信息
print(df.info())
print('\n')
print(dic_df.info()

运行结果

这里显示的信息都是以列为单位(columns)

df.head(i)
显示前头几行数据,以行为单位,index
print(df.head(4))
print('\n')
print(dic_df.head(2))

 运行结果

 

df.tail(i)

从后头显示几条信息

print(df.tail(4))
print('\n')
print(dic_df.tail(1))

运行结果

df.describe()

查看数据值列的汇总统计

可返回变量和观测的数量、缺失值和唯一值的数目、平均值、分位数等相关信息

print(dic_df.describe().T)
print('\n')
print(dic_df.describe())

运行结果

 


免责声明!

本站转载的文章为个人学习借鉴使用,本站对版权不负任何法律责任。如果侵犯了您的隐私权益,请联系本站邮箱yoyou2525@163.com删除。



 
粤ICP备18138465号  © 2018-2025 CODEPRJ.COM