Box-Cox變換


簡介

編輯
Box-Cox變換的一般形式為:
式中
   
為經Box-Cox變換后得到的新變量,
   
為原始連續因變量,
   
為變換參數。以上變換要求原始變量
   
取值為正,若取值為負時,可先對所有原始數據同加一個常數
   
使其
   
為正值,然后再進行以上的變換。對不同的
   
所作的變換不同。在
   
時該變換為對數變換,
   
時為倒數變換,而在
   
時為平方根變換。Box-Cox變換中參數
   
的估計有兩種方法:(1) 最大似然估計;(2)Bayes方法。通過求解
   
值,就可以確定具體采用哪種變換形式。

變換過程

編輯
Box-Cox變換是對回歸因變量Y的如下變換:
在這里
   
是一個待定變換參數。對於不同的
   
,所作的變換也不相同,所以Box-Cox變換是一族變換,它包括了平方根變換(
   
),對數變換(
   
)和倒數變換(
   
)等常用變換,對因變量的n個觀測值
   
,應用上述變換,可得變換后的向量
我們要確定變換參數
   
,使得
   
滿足
即要求通過因變量的變換,使得變換過的向量
   
與回歸自變量具有線性相依關系,誤差也服從正態分布.誤差各分量是等方差且相互獨立,故Box-Cox變換是通過參數
   
的適當選擇。達到對原來數據的“綜合治理”,使其滿足一個正態線性回歸模型的所有假設條件。
用極大似然方法來確定
   
,由於
   
,故對固定的
   
   
   
的似然函數為
其中,
   
為變換的Jacobi行列式
   
固定時,
   
是不依賴於參數
   
   
的常數因子,
   
的其余部分關於
   
   
求導數,令其等於零,可求得
   
   
的極大似然估計
殘差平方和為
對應的似然最大值為
該式為
   
的一元函數,通過求它的最大值來確定
   
,因為
   
是x的單調函數,問題可轉化為求
   
的最大值,對式(3)求對數,略去與
   
無關的常數項,得
其中,
式(4)對Box-Cox變換在計算機上實現帶來很大的方便,因為我們只要求出殘差平方和
   
的最小值,就可以求出
   
的最大值,雖然很難找出使
   
達到最小值的
   
的解析表達式,但是對一系列的
   
給定值,通過最普通的求最小二乘估計的回歸程序,很容易計算出對應的
   
,畫出
   
關於
   
的曲線,可在圖上近似地找出
   
達到最小值的
   
Box-Cox變換變換的具體步驟如下:
(1)對給定的
   
值,計算
   
,如果
   
,用式(6)計算,否則用式(7);
(2)利用式(5)計算 殘差平方和
   
(3)對一系列的
   
值,重復上述步驟,得到相應的殘差平方和
   
的一串值,以
   
為橫軸,作出相應的曲線,用直觀的方法,找出使
   
達到最小值的點
   
(4)利用式(2),求出
   

意義

編輯
Box-Cox變換的一個顯著優點是通過求變換參數
   
來確定變換形式,而這個過程完全基於數據本身而無須任何先驗信息,這無疑比憑經驗或通過嘗試而選用 對數平方根等變換方式要客觀和精確。
Box-Cox變換的目的是為了讓數據滿足線性模型的基本假定,即線性、正態性及方差齊性,然而經Box-Cox變換后數據是否同時滿足了以上假定,仍需要考察驗證  [2]  。


免責聲明!

本站轉載的文章為個人學習借鑒使用,本站對版權不負任何法律責任。如果侵犯了您的隱私權益,請聯系本站郵箱yoyou2525@163.com刪除。



 
粵ICP備18138465號   © 2018-2025 CODEPRJ.COM