· 來源:http://www.dxy.cn/bbs/thread/6492633#6492633
6樓:
“據我所知,SD( standard deviation )反應的是觀測值的變異性,其表示平均數的代表性,而SEM是 standard error of mean, 是平均數的抽樣誤差,反應平均數的抽樣准確性,由於真實值是不知道的,統計估計值的准確性無法度量,但利用統計學方法可以度量精確性。試驗的誤差來源有系統誤差和抽樣誤差(隨機誤差),系統誤差易於克服,抽樣誤差由許多無法控制的內因和外因,帶有偶然性,在試驗中即使十分小心也難以消除,但可以通過增加重復數來來降低。 對於重復數少的小樣本(n≤30)用mean ± S.E.M.,重復數多的大樣本(n>30)用 mean ± SD。”
· WIKI: https://en.wikipedia.org/wiki/Standard_error
The standard error of the mean (SEM) is the standard deviation of the sample-mean's estimate of a population mean. (It can also be viewed as the standard deviation of the error in the sample mean with respect to the true mean, since the sample mean is an unbiased estimator.) SEM is usually estimated by the sample estimate of the population standard deviation (sample standard deviation) divided by the square root of the sample size (assuming statistical independence of the values in the sample):
where
- s is the sample standard deviation (i.e., the sample-based estimate of the standard deviation of the population), and
- n is the size (number of observations) of the sample.
· 區分“standard deviation”(標准差)和“standard errer”(標准誤(差))
標准差:衡量一組數的離散程度,標准誤:樣本統計量的標准差,是衡量樣本抽樣的誤差的指標。
來源:http://www.zhihu.com/question/21925923
standard deviation是標准差 表示一組數值之間的離散程度
計算公式:
簡單來說就是一組數據的每一個數與該組數據的平均值比較,通過得出來的數值看這組數據的離散程度。比如,全班男同學身高都差不多是1.75m,那么我們可以說這個班的男生身高標准差很小,因為大家都接近平均值就是說數據很集中。可是,五個姚明,十個潘長江組成一組,嗯,這個身高數據很離散,參差不齊,標准差很大....
standard error 是標准誤 是樣本統計量的標准差
在現實中,我們無法得知總體情況,總是以樣本的分布情況去推斷總體。比如,我國在校大學生每月伙食費用是多少。對於這個問題,我們不能全國范圍統計各大高校每個同學的伙食費,於是,我們就用樣本推斷總體大概情況以得出我們所需要的數據。比如,抽取我國都東西南北部分高校部分同學的伙食費進行研究。而此時,標准誤產生了。它是衡量樣本抽樣的誤差的指標。
再舉一個例子說清楚問題。
比如總體是1 2 3 4 5 6 7 8 9 10 總體平均數是:5.5
而甲對總體進行抽樣,可能得到 5 8 3 2 平均數是4.5
乙進行抽樣,得到 3 7 9 2 平均數5.25
丙抽樣,得到 4 6 9 2 4 1 平均數為4.3
丁...............................平均數為x
那么,4.5, 5.25 ,4.3.........x 組成一個新分布,這是一個以樣本平均數為分布的,那么這個分布的標准差是什么呢?利用公式,我們可以得出這個分布的標准差,而這個標准差就是標准誤。(當然這個分布的統計量有平均數,標准差,方差,相關系數等等。而我們這里以平均數為栗子。)
如果知道總體的標准差,
如果,不知道總體的標准差,用樣本的標准差,采用它的無偏估計
簡單說就是統計量(樣本)的標准差。
· 來源: http://blog.sciencenet.cn/blog-479412-481776.html
標准差表示數據的離散程度,或者說數據的波動大小。標准誤表示抽樣誤差的大小。
統計教材上一般都寫標准誤表示均數的抽樣誤差,這對於初學者很難理解。這里通過舉例來說明含義。
比如,有一個學校,學校中共有1000名學生,則這1000名學生可以作為這個學校學生的總體。如果我想了解所有學生的身高,采用隨機抽樣,抽取了50人。這50人就是一個樣本。這里需要注意:一個樣本並不是指一個人,而是指一次抽樣。一個樣本可以是1個人,也可以是100人,這里的1和100就是樣本大小。
從理論上講,抽樣誤差表示這樣的意思:即如果不止抽樣一次,而是抽樣10次,每次都50人,那么我就有10個均數和標准差。總體1000人,一個樣本,即50人。每個樣本都能計算計算一個均數和標准差。
以這10個均數作為原始數據,仍然能計算出一個均數和標准差,以這10個均數計算出的標准差就稱之為標准誤。這是理論上的含義,實際的含義就代表抽樣誤差的大小,即抽取的樣本代表性好不好,抽樣誤差越小,代表性越好,反之,代表性越差。
如果我對學校中的1000人都測量了身高,那理論上就沒有標准誤,也就是沒有抽樣誤差了,因為我測量了總體,這時就不存在標准誤了。但是標准差是存在的,因為這1000人的身高肯定不同,肯定會有波動。這里就充分表明了標准差和標准誤的區別了。
標准差與標准誤的意義、作用和使用范圍均不同。標准差(亦稱單數標准差)一般用s 表示,是表示個體間變異大小的指標,反映了整個樣本對樣本平均數的離散程度,是數據精密度的衡量指標;而標准誤一般用Sx 表示,反映樣本平均數對總體平均數的變異程度,從而反映抽樣誤差的大小,是量度結果精密度的指標。


在實際的應用中,標准差主要有兩點作用,一是用來對樣本進行標准化處理,即樣本觀察值減去樣本均值,然后除以標准差,這樣就變成了標准正態分布;二是通過標准差來確定異常值,常用的方法就是樣本均值加減n倍的標准差。標准誤的作用主要是用來做區間估計,常用的估計區間是均值加減n倍的標准誤。