數據標准化處理,data.mean和data.std

本文轉載自查看原文 2018-05-12 20:03 3697 數據分析挖掘

工作中經常遇到每個指標數據取值范圍過大,為了消除數量級帶來的另想,需要進行標准化處理.

#-*- coding: utf-8 -*-
#標准差標准化

import pandas as pd

datafile = '../data/zscoredata.xls' #需要進行標准化的數據文件；
zscoredfile = '../tmp/zscoreddata.xls' #標准差化后的數據存儲路徑文件；

#標准化處理
data = pd.read_excel(datafile)
# print(data.mean(axis=0));exit()
data = (data - data.mean(axis = 0))/(data.std(axis = 0)) #簡潔的語句實現了標准化變換，類似地可以實現任何想要的變換。
# data.mean(axis=0) 輸出矩陣為一行,求每列的平均值,同理data.mean(axis=1) 輸出矩陣為一列,求每行的平均值
# data.std(axis=0) 輸出矩陣為一列,求每列的標准差,同理data.std(axis=1) 輸出矩陣為一列,求每行的標准差
#標准差也成為標准偏差,表示數據的離散程度,和標准差大小成反比
data.columns=['Z'+i for i in data.columns] #表頭重命名。

data.to_excel(zscoredfile, index = False) #數據寫入

免責聲明！

本站轉載的文章為個人學習借鑒使用，本站對版權不負任何法律責任。如果侵犯了您的隱私權益，請聯系本站郵箱yoyou2525@163.com刪除。

猜您在找 數據處理 - 標准化歸一化處理數據什么時候需要做中心化和標准化處理？計算圖像數據集的均值和方差(mean, std)用於transforms.Normalize()標准化對數據集做標准化處理的幾種方法——基於R語言數據標准化-對數處理數據預處理之標准化數據標准化三、標准化數據 matlab對數據標准化歸一化的處理 python數據標准化