pandas归一化操作


归一化操作有两种

1.max和min的归一化操作

min-max标准化(Min-Max Normalization)

返回结果0~1

公式:

实例:

如:

随机生成假数据如下

df = DataFrame({"height":np.random.randint(150,190,size=50),
"weight":np.random.randint(40,90,size = 50),
"sex":np.random.randint(0,2,size = 50)})
df

对数据进行归一化操作

df = (df-df.min())/(df.max()-df.min())
df

 

df.info()     #函数info()是对我们dataform中的数据进行说明

信息如下

 

df.describe()         #describe()是根据每一列对数据进行汇总

 

2.Z-score标准化方法

方法:

返回结果:返回的结果是标准值为1,平均值为0,标准的正态分布数据

实例如下:

df2 = (df-df.mean())/df.std()           #df数据减去df平均值,再出去df的标准差就是归一化,归一化后变准值为1
df2

df2.describe()

 


免责声明!

本站转载的文章为个人学习借鉴使用,本站对版权不负任何法律责任。如果侵犯了您的隐私权益,请联系本站邮箱yoyou2525@163.com删除。



 
粤ICP备18138465号  © 2018-2025 CODEPRJ.COM