相關性與自相關性


相關系數度量指的是兩個不同事件彼此之間的相互影響程度;而自相關系數度量的是同一事件在兩個不同時期之間的相關程度,形象的講就是度量自己過去的行為對自己現在的影響。

自相關,也稱 序列相關。是一個信號於其自身在不同時間點的互相關。非正式地來說,它就是兩次觀察之間的相似度對它們之間的時間差的函數。它是找出重復模式(如被噪聲掩蓋的周期信號),或識別隱含在信號諧波頻率中消失的基頻的數學工具。它常用於信號處理中,用來分析函數或一系列值,如時域信號。

皮爾森相關:

由於在自相關時,x的期望和方差不隨着時間的變化而改變。則自相關函數可以表示為時間延遲  的函數,如下:

,自相關函數是表達信號和它的多徑信號的相似程度。一個信號經過類似於反射、折射等其它情況的延時后的副本信號與原信號的相似程度。

主要性質如下:

(1)自相關函數為偶函數,其圖形對稱於縱軸。
(2)當s=t 時,自相關函數具有最大值,且等於信號的均方值,即
(3)周期信號的自相關函數仍為同頻率的周期信號。

意義:

 兩個相關函數都是對相關性,即相似性的度量。如果進行歸一化,會看的更清楚。
自相關就是函數和函數本身的相關性,當函數中有周期性分量的時候,自相關函數的極大值能夠很好的體現這種周期性。互相關就是兩個函數之間的相似性,當兩個函數都具有相同周期分量的時候,它的極大值同樣能體現這種周期性的分量。


  相關運算從線性空間的角度看其實是內積運算,而兩個向量的內積在線性空間中表示一個向量向另一個向量的投影,表示兩個向量的相似程度,所以相關運算就體現了這種相似程度。

R語言計算相關系數,首先需要加載cor()函數包,它可以計算三種不同的相關系數如Pearson相關系數、Spearman相關系數、Kendall相關系數。而pcor()函數包則是計算偏相關系數。

 acf(c2)     #自相關圖
> pacf(c2)   #偏自相關圖

相關系數可視化:https://blog.csdn.net/flyfrommath/article/details/76777412

參考:https://blog.csdn.net/dengheCSDN/article/details/78848046

 

偏相關分析是指當兩個變量同時與第三個變量相關時,將第三個變量的影響剔除,只分析另外兩個變量之間相關程度的過程,判定指標是相關系數的R值。

偏相關分析的主要作用在於,在所有的自變量中,判斷哪些自變量對因變量的影響較大,從而選擇作為必需的自變量,至於那些對因變量影響較小的自變量就可以舍去而不予考慮。這樣,在計算多元回歸方程時,只要保留起主要作用的自變量,用較少的自變量描述因變量的平均變動量。 

某一個要素對另一個要素的影響或相關程度時,把其他要素的影響視為常數,即暫不考慮其他要素的影響,而單獨研究那兩個要素之間的 相互關系的密切程度時,稱為偏相關。

在排除了其他變量的影響情況下再計算兩變量的(簡單)相關系數


免責聲明!

本站轉載的文章為個人學習借鑒使用,本站對版權不負任何法律責任。如果侵犯了您的隱私權益,請聯系本站郵箱yoyou2525@163.com刪除。



 
粵ICP備18138465號   © 2018-2025 CODEPRJ.COM