處理數據要用到Pandas,但是沒有學過,不知道是否有直接對某一列歸一化的方法調用。自己倒弄了下。感覺還是比較麻煩。
使用Pandas讀取到數組之后想把其中的‘MonthlyIncome’一列進行歸一化,網上的栗子都是對整個dataframe進行歸一化,因為我的數據有些列是類別,不能使用:
import pandas as pd import numpy as np #加載數據 #cvs df = pd.read_csv("train1.csv") #規格化 s = (df['MonthlyIncome'] - df['MonthlyIncome'].min())/(df['MonthlyIncome'].max() - df['MonthlyIncome'].min()) #安全刪除,如果用del是永久刪除 df2 = df.drop(['MonthlyIncome'],axis=1) #把規格化的那一列插入到數組中,最開始的14是我把他插到了第15lie df2.insert(14,'MonthlyIncome',s)
print(df2.columns[13:15])