1.公式:
log1p = log(x+1) 【當x很小時,log(x)會出錯。】
exmp1 = exp(x) -1 【當x很大時,會報錯overflow】
兩者互為反函數
2.使用場景:
如果數據非正態,有左偏情況,可以使用log1p進行平滑
可以看出,使用log1p后,數據明顯正態化。
同理,如果數據明顯左偏,使用expm1效果會更好
3.其他
3.1 嘗試使用cox-box,它自動幫你判斷數據是右偏還是左偏並選擇合適的正態化函數。(具體python API為:scipy.special.boxcox1p)
3.2 均方根對數誤差