數據面試題:正態分布、偏態分布及峰態分布


面試題1:(答案)右偏分布

面試題2:(答案)C,正態分布的偏度為0,峰度為3

面試題3:(答案)C

面試題4:(答案)AC

 

相關系數

:考察兩個事物(在數據里我們稱之為變量)之間的相關程度。

 

如果有兩個變量:X、Y,最終計算出的相關系數的含義可以有如下理解:

(1)、當相關系數為0時,X和Y兩變量無關系。

(2)、當X的值增大(減小),Y值增大(減小),兩個變量為正相關,相關系數在0.00與1.00之間。

(3)、當X的值增大(減小),Y值減小(增大),兩個變量為負相關,相關系數在-1.00與0.00之間。

 

相關系數的絕對值越大,相關性越強,相關系數越接近於1或-1,相關度越強,相關系數越接近於0,相關度越弱。

通常情況下通過以下取值范圍判斷變量的相關強度:
相關系數     0.8-1.0     極強相關
                 0.6-0.8     強相關
                 0.4-0.6     中等程度相關
                 0.2-0.4     弱相關
                 0.0-0.2     極弱相關或無相關

 

ARMA相關資料

 

 

正偏態與負偏態

在正偏態分布中,為什么平均數大於中位數大於眾數?在負偏態分布中,為什么眾數大於中位數大於平均數?

偏度系數Skewness)用來度量分布是否對稱。正態分布左右是對稱的,偏度系數為0。較大的正值表明該分布具有右側較長尾部。較大的負值表明有左側較長尾部。偏度系數與其標准誤的比值同樣可以用來檢驗正態性。

峰度系數的概念:峰度系數是用來反映頻數分布曲線頂端尖峭或扁平程度的指標。有時兩組數據的算術平均數、標准差和偏態系數都相同,但他們分布曲線頂端的高聳程度卻不同。

峰度系數(Kurtosis)用來度量數據在中心聚集程度。

正態分布情況下,峰度系數值是3(但是SPSS等軟件中將正態分布峰度值定為0,是因為已經減去3,這樣比較起來方便)。

>3的峰度系數說明觀察量更集中,有比正態分布更短的尾部;<3的峰度系數說明觀測量不那么集中,有比正態分布更長的尾部,類似於矩形的均勻分布。

峰度系數的標准誤用來判斷分布的正態性。峰度系數與其標准誤的比值用來檢驗正態性。如果該比值絕對值大於2,將拒絕正態性。

 


免責聲明!

本站轉載的文章為個人學習借鑒使用,本站對版權不負任何法律責任。如果侵犯了您的隱私權益,請聯系本站郵箱yoyou2525@163.com刪除。



 
粵ICP備18138465號   © 2018-2025 CODEPRJ.COM