Pandas(python)数据处理:只对某一列DataFrame数据进行归一化


  处理数据要用到Pandas,但是没有学过,不知道是否有直接对某一列归一化的方法调用。自己倒弄了下。感觉还是比较麻烦。

  使用Pandas读取到数组之后想把其中的‘MonthlyIncome’一列进行归一化,网上的栗子都是对整个dataframe进行归一化,因为我的数据有些列是类别,不能使用:

  

import pandas as pd
import numpy as np
#加载数据
#cvs

df = pd.read_csv("train1.csv")

#规格化
s = (df['MonthlyIncome'] - df['MonthlyIncome'].min())/(df['MonthlyIncome'].max() - df['MonthlyIncome'].min())

#安全删除,如果用del是永久删除

df2 = df.drop(['MonthlyIncome'],axis=1)

#把规格化的那一列插入到数组中,最开始的14是我把他插到了第15lie

df2.insert(14,'MonthlyIncome',s)
print(df2.columns[13:15])

 


免责声明!

本站转载的文章为个人学习借鉴使用,本站对版权不负任何法律责任。如果侵犯了您的隐私权益,请联系本站邮箱yoyou2525@163.com删除。



 
粤ICP备18138465号  © 2018-2025 CODEPRJ.COM