由於模型是以特定時期的樣本所開發的,此模型是否適用於開發樣本之外的族群,必須經過穩定性測試才能得知。穩定度指標(population stability index ,PSI)可衡量測試樣本及模型開發樣本評分的的分布差異,為最常見的模型穩定度評估指針。其實PSI表示的就是按分數分檔后,針對不同樣本,或者不同時間的樣本,population分布是否有變化,就是看各個分數區間內人數占總人數的占比是否有顯著變化。公式如下:
這里的AC與EX為不同時間段的模型輸出分數,如果PSI過大,說明模型輸出的分數分布變化很大了,需要更新模型。
PSI實際應用范例:
1)樣本外測試
針對不同的樣本測試一下模型穩定度,比如訓練集與測試集,也能看出模型的訓練情況,我理解是看出模型的方差情況。
2)時間外測試
測試基准日與建模基准日相隔越遠,測試樣本的風險特征和建模樣本的差異可能就越大,因此PSI值通常較高。至此也可以看出模型建的時間太長了,是不是需要重新用新樣本建模了。
變量的PSI計算:
PSI:檢驗變量的穩定性,當一個變量的psi值大於0.0001時,變量不穩定。
一個變量,將它的取值按照分位數來分組一下,每一組中測試模型的客戶數占比減去訓練模型中的客戶數占比再乘以這兩者相除的對數,
就是這一組的穩定性系數psi,然后變量的psi系數就是把這個變量的所有組的psi相加總起來。
======================
PSI群體穩定性指標(population stability index)
psi = sum((實際占比-預期占比)/ln(實際占比/預期占比))
舉個例子解釋下,比如一個評分卡模型,按天為維度計算PSI,我們把模型剛上線第一天(設定為一個基期)的各分數段用戶占比作為預期占比P1,之后每天的各分數段用戶占比作為實際占比P2,這樣根據公式就可以計算出每天的PSI值,通過觀測這些PSI的大小和走勢,從而實現對評分卡穩定性的監測。通常PSI會以日、周和月為維度進行計算,同時也會對評分卡模型中各個特征變量分別做PSI監測。
模型分數的變化可能由特征變化引起,也可能是模型本身不穩定引起,若是高分段總數量沒變,而psi值變動較大,認為需要重訓模型。
若是psi值沒變,高分段總數量變多,認為整體用戶變好。
https://blog.csdn.net/sinat_26917383/article/details/51721107