參考鏈接:https://www.zhihu.com/question/20852004
方差:
度量單個隨機變量的離散程度,公式如下:
方差表示一位數據數據的離散程度,數值越大說明離均值的差距越大,越離散
協方差:
度量兩個隨機變量(變化趨勢)的相似程度,定義如下:
協方差表示二維數據,表示兩個變量在變化的過程中是正相關還是負相關還是不相關
- 正相關,你變大的同時,我也變大, 說明變量是同向變化,這時候協方差就是正的
- 負相關,你變大的同時,我變小,說明變量兩個變量是反向變化的,這時候協方差就是負的
- 從數值來看,協方差的數值越大,兩個變量的同向程度也就越大,反之亦然
相關系數。
由協方差的概念相關系數,其定義如下:
就是用X、Y的協方差除以X的標准差和Y的標准差。