norm表示正態分布:
rnorm(x):表示生成隨機x個正態分布的序列,random
dnorm(x):輸出正態分布的概率密度函數,density function————plot(dnorm(x)),畫出密度曲線
pnorm(x):輸出正態分布的分布函數,概率函數,probability function
【對於連續分布,分布函數就是從負無窮到x對概率密度函數的積分的結果】
qnorm(p):分位函數,quantile fuction。給出一個概率p,函數返回一個x,表明概率為p時的x值。
[設連續隨機變量X的分布函數為F(X),密度函數為p(x)。那么,對任意0<p<1的p,稱F(X)=p的x為此分布的分位數,或者下側分位數。簡單的說,分位數指的就是連續分布函數中的一個點,這個點對應概率p。]
help(dnorm):
dnorm gives the density, pnorm gives the distribution function, qnorm gives the quantile function[分位函數], and rnorm generates random deviates.
dnorm(x, mean = 0, sd = 1, log = FALSE) 默認情況下是標准正態分布
pnorm(q, mean = 0, sd = 1, lower.tail = TRUE, log.p = FALSE)
qnorm(p, mean = 0, sd = 1, lower.tail = TRUE, log.p = FALSE)
rnorm(n, mean = 0, sd = 1)
x, q: vector of quantiles. 向量的分位數
p:vector of probabilities. 向量概率
n:number of observations. If length(n) > 1, the length is taken to be the number required.
mean:vector of means.
sd:vector of standard deviations.
log, log.p:logical; if TRUE, probabilities p are given as log(p).
如果log.p=TRUE,則在用qnorm(p)計算時變成qnrom(log(p))來計算。【由於概率p介0~1之間,當超出這個范圍后,用此方法相當於是擴大的計算范圍。如qnorm(-.5,log.p=F) == qnorm(log(-.5),log.p=F),后來驗證,這種理解是錯誤的,正確的是什么?】
lower.tail:logical; if TRUE (default), probabilities are P[X ≤ x] otherwise, P[X > x].
如果lower.tail=TRUE,則計算的是左側面積的概率,即P[X ≤ x];否則就是右側 P[X > x]=1-P[X ≤ x]
正態分布函數:
,此式中當 μ=0, σ=1時,
標准正態分布函數為:

便於理解公式的幾個有趣例子:
dnorm(0) == 1/sqrt(2*pi),此時x=0, μ=0, σ=1
dnorm(1) == exp(-1/2)/sqrt(2*pi),下面式子的等價寫法
dnorm(1) == 1/sqrt(2*pi*exp(1)),此時x=1, μ=0, σ=1
對於分位數的補充:
分位數函數:分位數函數是累積分布函數【概率函數】的反函數,也就是說,給定概率值,計算出隨機變量的取值(左側分位數)。
常用的有四個分布的分位數:
標准正態分布,qnorm(p, mean=0, sd=1)
Student’s (t) , qt(p,df=N,ncp=0)
卡方分布:qchisq(p, df=N,ncp=0)
Fisher-Snedecor:qf(p, df1,df2,ncp=0)
特例:
四分位數:四分位數是統計學中分位數的一種,即把所有的數值從小到大朴烈並分為四等分,處於三個分割點的數就是四分位數。
