#皮爾遜相關系數: 用於度量兩個變量X和Y之間的相關(線性相關),其值介於-1與1之間
from scipy.stats import pearsonr x = [0.5, 0.4, 0.6, 0.3, 0.6, 0.2, 0.7, 0.5] y = [0.6, 0.4, 0.4, 0.3, 0.7, 0.2, 0.5, 0.6] print(pearsonr(x, y)) # 輸出:(r, p) # r:相關系數[-1,1]之間 # p:相關系數顯著性
相關性的強度確實是用相關系數的大小來衡量的,但相關大小的評價要以相關系數顯著性的評價為前提
因此,要先檢驗相關系數的顯著性,如果顯著,證明相關系數有統計學意義,下一步再來看相關系數大小,如果相關系數沒有統計學意義,那意味着你研究求得的相關系數也許是抽樣誤差或者測量誤差造成的,再進行一次研究結果可
能就大不一樣,此時討論相關性強弱的意義就大大減弱了。【“The p-values are not entirely reliable but are probably reasonable for datasets larger than 500 or so.”,p-value在500個樣本值以上有較高的可靠性】
在滿足相關系數顯著的條件下,相關系數越大,相關性就越強
