加載完數據后,需要對數據的全貌有所了解。源Excel文件df_info.xlsx:
一、抽樣查看
df.head() # 查看前五行
df.head(8) # 查看前8條數據
df.tail() # 查看后五條數據
df.tail(8) # 查看后8條數據
df.sample() # 隨機查看一條數據
df.sample(5) # 隨機查看5條數據
二、形狀
s = df.數學 # 其中一列,Series
df.shape
s.shape

三、基本信息df.info()
df.info()查看數據框行索引范圍RangeIndex、列數據類型columns、是否有缺失、每列行統計、內存大小memory usage。Series不支持。
df.info()
# s.info()

四、數據類型df.dtypes
df.dtypes
s.dtype
五、索引值內容df.axes
df.axes
s.axes # series只有行索引

六、其他常見信息
信息查看操作,DataFrame 和 Series 一般都支持。但也有一些區別。
df.ndim # 2 維度數
df.size # 行x列的總數,就是總共有多少個數據
# 是否為空,注意有空值不認為是空,nan值
df.empty # False
# 轉換為Adarray 列表矩陣
df.values
# df.to_numpy() # 官方建議用這個,pandas0.24+版本才有
