正態QQ圖的原理


正態QQ圖的原理

QQ圖通過把測試樣本數據的分位數與已知分布相比較,從而來檢驗數據的分布情況。QQ圖是一種散點圖,對應於正態分布的QQ圖,就是由標准正態分布的分位數為橫坐標,樣本值為縱坐標的散點圖。要利用QQ圖鑒別樣本數據是否近似於正態分布,只需看QQ圖上的點是否近似地在一條直線附近,圖形是直線說明是正態分布,而且該直線的斜率為標准差,截距為均值,用QQ圖還可獲得樣本偏度和峰度的粗略信息。圖形中有一段是直線,在兩端存在弧度,則可說明峰度的情況。圖形是曲線圖,說明不對稱。如果Q-Q圖是直線,當該直線成45度角並穿過原點時,說明分布與給定的正態分布完全一樣。如果是成45度角但不穿過原點,說明均值與給定的正態分布不同,如果是直線但不是45度角,說明均值與方差都與給定的分布不同。如果Q-Q圖中間部分是直線,但是右邊在直線下面,左邊在直線上面,說明分布的峰度大於3,反之說明峰度小於3;圖形是曲線圖,說明不對稱。

分位數(quantile fractile)又稱百分位點,或者下側分位數。 定義:設連續隨機變量X的分布函數為F(X),密度函數為p(x)。那么,對任意0<p<1的p,稱F(X)=p的x為此分布的分位數,或者下側分位數。簡單的說,分位數指的就是連續分布函數中的一個點,這個點對應概率p。

R語言模擬

rd=rnorm(100) 
plot(density(rd),main = "正態隨機變量概率密度",lwd=2)
points(rd,rep(0.01,100),pch=20,col=rainbow(100))

通過上圖可以看出,產生的100個隨機數多數集中在[-1,1]之間,且均值為0。

t=rank(rd)/100 #求觀察累積概率
q=qnorm(t) #用累積概率求分位數值
plot(rd,q,main = "Q-Q圖",pch=20,col=rainbow(100)) #畫Q-Q圖
abline(0,1,lwd=2)

第二次模擬1000個隨機數

n=1000
rd=rnorm(n) 
plot(density(rd),main = "正態隨機變量概率密度",lwd=2)
points(rd,rep(0.01,n),pch=20,col=rainbow(n))

t=rank(rd)/n #求觀察累積概率
q=qnorm(t) #用累積概率求分位數值
plot(rd,q,main = "Q-Q圖",pch=20,col=rainbow(n)) #畫Q-Q圖
abline(0,1,lwd=2)

第三次模擬5000個隨機數

n=2000
rd=rnorm(n) 
plot(density(rd),main = "正態隨機變量概率密度",lwd=2)
points(rd,rep(0.01,n),pch=20,col=rainbow(n))

t=rank(rd)/n #求觀察累積概率
q=qnorm(t) #用累積概率求分位數值
plot(rd,q,main = "Q-Q圖",pch=20,col=rainbow(n)) #畫Q-Q圖
abline(0,1,lwd=2)

可見,通過QQ圖可以看出,樣本值越大,隨機數的分布狀態越近似於正態分布。

反饋與建議


免責聲明!

本站轉載的文章為個人學習借鑒使用,本站對版權不負任何法律責任。如果侵犯了您的隱私權益,請聯系本站郵箱yoyou2525@163.com刪除。



 
粵ICP備18138465號   © 2018-2025 CODEPRJ.COM