數據分布轉換:非正態 -> 正態


來源:丁香園論壇:SPSS上的把非正態分布數據轉換為正態分布數據

一樓

可以應用變量變換的方法,將不服從正態分布的資料轉化為非正態分布或近似正態分布。常用的變量變換方法有對數變換、平方根變換、倒數變換、平方根反正玄變換等,應根據資料性質選擇適當的變量變換方法。

  • 對數變換
    即將原始數據X的對數值作為新的分布數據:
    X’=lgX
    當原始數據中有小值及零時,亦可取X’=lg(X+1)
    還可根據需要選用X’=lg(X+k)或X’=lg(k-X)
    對數變換常用於(1)使服從對數正態分布的數據正態化。如環境中某些污染物的分布,人體中某些微量元素的分布等,可用對數正態分布改善其正態性。(2)使數據達到方差齊性,特別是各樣本的標准差與均數成比例或變異系數CV接近於一個常數時。

  • 平方根變換
    即將原始數據X的平方根作為新的分布數據。
    X’=sqrt(X)
    平方根變換常用於:1)使服從Poission分布的計數資料或輕度偏態資料正態化,可用平方根變換使其正態化。2)當各樣本的方差與均數呈正相關時,可使資料達到方差齊性。

  • 倒數變換
    即將原始數據X的倒數作為新的分析數據。
    X’=1/X
    常用於資料兩端波動較大的資料,可使極端值的影響減小。

  • 平方根反正旋變換
    即將原始數據X的平方根反正玄值做為新的分析數據。
    X’=sin-1sqrt(X)
    常用於服從二項分布的率或百分比的資料。一般認為等總體率較小如<30%時或較大(如>70%時),偏離正態較為明顯,通過樣本率的平方根反正玄變換,可使資料接近正態分布,達到方差齊性的要求。
    你可以根據自己的資料適當轉化。另外,可以考慮其他分析方法,比如秩和檢驗。


免責聲明!

本站轉載的文章為個人學習借鑒使用,本站對版權不負任何法律責任。如果侵犯了您的隱私權益,請聯系本站郵箱yoyou2525@163.com刪除。



 
粵ICP備18138465號   © 2018-2025 CODEPRJ.COM