面試題1:(答案)右偏分布
面試題2:(答案)C,正態分布的偏度為0,峰度為3
面試題3:(答案)C
面試題4:(答案)AC
相關系數
:考察兩個事物(在數據里我們稱之為變量)之間的相關程度。
如果有兩個變量:X、Y,最終計算出的相關系數的含義可以有如下理解:
(1)、當相關系數為0時,X和Y兩變量無關系。
(2)、當X的值增大(減小),Y值增大(減小),兩個變量為正相關,相關系數在0.00與1.00之間。
(3)、當X的值增大(減小),Y值減小(增大),兩個變量為負相關,相關系數在-1.00與0.00之間。
相關系數的絕對值越大,相關性越強,相關系數越接近於1或-1,相關度越強,相關系數越接近於0,相關度越弱。
通常情況下通過以下取值范圍判斷變量的相關強度:
相關系數 0.8-1.0 極強相關
0.6-0.8 強相關
0.4-0.6 中等程度相關
0.2-0.4 弱相關
0.0-0.2 極弱相關或無相關
ARMA相關資料
正偏態與負偏態
在正偏態分布中,為什么平均數大於中位數大於眾數?在負偏態分布中,為什么眾數大於中位數大於平均數?
偏度系數(Skewness)用來度量分布是否對稱。正態分布左右是對稱的,偏度系數為0。較大的正值表明該分布具有右側較長尾部。較大的負值表明有左側較長尾部。偏度系數與其標准誤的比值同樣可以用來檢驗正態性。
峰度系數的概念:峰度系數是用來反映頻數分布曲線頂端尖峭或扁平程度的指標。有時兩組數據的算術平均數、標准差和偏態系數都相同,但他們分布曲線頂端的高聳程度卻不同。
峰度系數(Kurtosis)用來度量數據在中心聚集程度。
在正態分布情況下,峰度系數值是3(但是SPSS等軟件中將正態分布峰度值定為0,是因為已經減去3,這樣比較起來方便)。
>3的峰度系數說明觀察量更集中,有比正態分布更短的尾部;<3的峰度系數說明觀測量不那么集中,有比正態分布更長的尾部,類似於矩形的均勻分布。
峰度系數的標准誤用來判斷分布的正態性。峰度系數與其標准誤的比值用來檢驗正態性。如果該比值絕對值大於2,將拒絕正態性。