一、數據類型
1、Pandas的數據類型主要結合了pandas和numpy兩個模塊中的數據類型,包括以下幾種:
- float
- int
- bool
- datetime64[ns]------>日期類型
- datetime64[ns,tz]--->日期類型
- timedelta[ns]------->時間差類型
- category
- object---->當一個Series僅包括字符串或是包括多種數據類型時為object類型
2、通過DateFrame對象的dtypes屬性,可得到各個特征的數據類型。
例如:df.dtypes
3、類型轉換:
(1)通過astype()轉換數據類型,默認情況下會產生對象轉換后的一個副本
df['A'] = df['A'].astype('int8')
(2)對多列進行類型轉換時,對astype()傳入一個字典。字典的鍵值對格式為列名:目標數據類型
df = df.astype({'A':'int8','B':'int32'})
二、數據篩選
select_dtypes()篩選出特定數據類型的特征
包括兩個參數:
- include:篩選時選取的數據類型
- exclude:篩選時排除的數據類型
df.select_dtypes(include=['float'],exclude=['int'])