Pearson相關系數


相關系數:考察兩個事物(在數據里我們稱之為變量)之間的相關程度。

EXCEL 公式: PEARSON(array1,array2)

Array1 自變量集合。

Array2 因變量集合。

說明

參數可以是數字,或是包含數字的名稱、數組常量或引用。
若數組或引用參數包含文本、邏輯值或空白單元格,則這些值將被忽略;但包含零值的單元格將計算在內。
若 array1 和 array2 為空或其數據點個數不同,則 PEARSON 返回錯誤值 #N/A。
Pearson(皮爾生)乘積矩相關系數 r 的公式為:

如果有兩個變量:X、Y,最終計算出的相關系數的含義可以有如下理解:

(1)、當相關系數為0時,X和Y兩變量無關系。

(2)、當X的值增大(減小),Y值增大(減小),兩個變量為正相關,相關系數在0.00與1.00之間。

(3)、當X的值增大(減小),Y值減小(增大),兩個變量為負相關,相關系數在-1.00與0.00之間。

相關系數的絕對值越大,相關性越強,相關系數越接近於1或-1,相關度越強,相關系數越接近於0,相關度越弱。

通常情況下通過以下取值范圍判斷變量的相關強度:
相關系數 0.8-1.0 極強相關
0.6-0.8 強相關
0.4-0.6 中等程度相關
0.2-0.4 弱相關
0.0-0.2 極弱相關或無相關

Pearson(皮爾遜)相關系數

1、簡介

皮爾遜相關也稱為積差相關(或積矩相關)是英國統計學家皮爾遜於20世紀提出的一種計算直線相關的方法。

假設有兩個變量X、Y,那么兩變量間的皮爾遜相關系數可通過以下公式計算:

公式一:

皮爾遜相關系數計算公式

公式二:

皮爾遜相關系數計算公式

公式三:

皮爾遜相關系數計算公式

公式四:

皮爾遜相關系數計算公式

以上列出的四個公式等價,其中E是數學期望,cov表示協方差,N表示變量取值的個數。

2、適用范圍

當兩個變量的標准差都不為零時,相關系數才有定義,皮爾遜相關系數適用於:

(1)、兩個變量之間是線性關系,都是連續數據。

(2)、兩個變量的總體是正態分布,或接近正態的單峰分布。

(3)、兩個變量的觀測值是成對的,每對觀測值之間相互獨立。


免責聲明!

本站轉載的文章為個人學習借鑒使用,本站對版權不負任何法律責任。如果侵犯了您的隱私權益,請聯系本站郵箱yoyou2525@163.com刪除。



 
粵ICP備18138465號   © 2018-2025 CODEPRJ.COM