數據分布轉換：非正態 -> 正態

本文轉載自查看原文 2017-01-07 17:44 6906 statistics

一樓

可以應用變量變換的方法,將不服從正態分布的資料轉化為非正態分布或近似正態分布。常用的變量變換方法有對數變換、平方根變換、倒數變換、平方根反正玄變換等，應根據資料性質選擇適當的變量變換方法。

對數變換
即將原始數據X的對數值作為新的分布數據：
X’=lgX
當原始數據中有小值及零時，亦可取X’=lg（X+1）
還可根據需要選用X’=lg（X+k）或X’=lg（k-X）
對數變換常用於（1）使服從對數正態分布的數據正態化。如環境中某些污染物的分布，人體中某些微量元素的分布等，可用對數正態分布改善其正態性。（2）使數據達到方差齊性，特別是各樣本的標准差與均數成比例或變異系數CV接近於一個常數時。
平方根變換
即將原始數據X的平方根作為新的分布數據。
X’=sqrt（X）
平方根變換常用於：1）使服從Poission分布的計數資料或輕度偏態資料正態化，可用平方根變換使其正態化。2）當各樣本的方差與均數呈正相關時，可使資料達到方差齊性。
倒數變換
即將原始數據X的倒數作為新的分析數據。
X’=1/X
常用於資料兩端波動較大的資料，可使極端值的影響減小。
平方根反正旋變換
即將原始數據X的平方根反正玄值做為新的分析數據。
X’=sin-1sqrt（X）
常用於服從二項分布的率或百分比的資料。一般認為等總體率較小如＜30%時或較大（如＞70%時），偏離正態較為明顯，通過樣本率的平方根反正玄變換，可使資料接近正態分布，達到方差齊性的要求。
你可以根據自己的資料適當轉化。另外，可以考慮其他分析方法，比如秩和檢驗。

免責聲明！

本站轉載的文章為個人學習借鑒使用，本站對版權不負任何法律責任。如果侵犯了您的隱私權益，請聯系本站郵箱yoyou2525@163.com刪除。

猜您在找 數據分析方法：非正態數據轉化成正態數據五、Doris數據分布數據類型與數據分布數據分布形態：峰度與偏度 Aerospike系列：7：數據分布詳解數據分布特征的描述正態分布及正態隨機變量 SPSS中，進行描述性統計，繪制箱線圖，直方圖，檢驗數據正態性分布等 greenplum查看表的數據分布情況來調整dk值 Origin 畫不等距數據分布直方圖