Pandas(python)數據處理:只對某一列DataFrame數據進行歸一化


  處理數據要用到Pandas,但是沒有學過,不知道是否有直接對某一列歸一化的方法調用。自己倒弄了下。感覺還是比較麻煩。

  使用Pandas讀取到數組之后想把其中的‘MonthlyIncome’一列進行歸一化,網上的栗子都是對整個dataframe進行歸一化,因為我的數據有些列是類別,不能使用:

  

import pandas as pd
import numpy as np
#加載數據
#cvs

df = pd.read_csv("train1.csv")

#規格化
s = (df['MonthlyIncome'] - df['MonthlyIncome'].min())/(df['MonthlyIncome'].max() - df['MonthlyIncome'].min())

#安全刪除,如果用del是永久刪除

df2 = df.drop(['MonthlyIncome'],axis=1)

#把規格化的那一列插入到數組中,最開始的14是我把他插到了第15lie

df2.insert(14,'MonthlyIncome',s)
print(df2.columns[13:15])

 


免責聲明!

本站轉載的文章為個人學習借鑒使用,本站對版權不負任何法律責任。如果侵犯了您的隱私權益,請聯系本站郵箱yoyou2525@163.com刪除。



 
粵ICP備18138465號   © 2018-2025 CODEPRJ.COM