分位數Quantiles


 什么是分位數?

 

隨機變量的分布與分位數概念

顯然,分位數是用來定位的,表示某個樣本在整個樣本空間中的位置信息。

通過CDF(累積分布函數)可以很好地理解分位數的概念。CDF是一個單調遞增的函數,F(q) = F(x<=q) 。CDF曲線中橫軸是隨機變量的取值,豎軸是小於某個取值的概率。

由於CDF單調遞增,因此一定存在一個逆函數F-1。F-1以小於某個取值的概率為輸入,以對應的隨機變量的取值為輸出。

如果已知P(X<=xalpha) = alpha  = F(Xalpha) ,則通過CDF的逆F-1可直接求出對應的Xalpha的取值Xalpha=F-1(alpha),Xalpha即為F的alpha分位點。

 

以下是一個均值=10,標准差=0.5的正態分布概率密度曲線的例子,x=9.020的垂線與該分布的概率密度曲線和X軸所圍成的左側區域面積=0.025,

該面積表示在隨機變量X的總體分布中,有2.5%的值小於9.020,也就是說在總體分布中,隨機變量X的取值小於9.020的概率為2.5%。

同樣,x=10.98的垂線與該分布的概率密度曲線和X軸所圍成的右側區域面積=0.025,該面積表示在隨機變量X的總體分布中,有2.5%的值大於10.98,

也就是說在總體分布中,隨機變量X的取值大於10.98的概率為2.5%(也即是隨機變量X的取值小於10.98的概率為97.5%)。

在這個分布中,x=9.020的值被稱為X的2.5%分位數(即:X2.5%=9.020),x=10.98的值被稱為X的97.5%分位數(X97.5%=10.98)。

隨機變量X有95%(即:97.5% - 2.5%=95%)的取值落在9.020至10.98之間。每個分位數都是隨機變量所有可能取值中的某個值。

按照定義,若某個值Xp被稱為隨機變量X的p分位數,則隨機變量X的取值小於Xp的概率為p。

                        隨機變量的分布與分位數概念
以下是該正態分布對應的累積概率分布曲線,該曲線的縱軸表示的是累積概率,比如:x=9.020對應的累積概率為2.5%(即:隨機變量X的取值小於x=9.020的概率為2.5%),

x=10對應的累積概率為50%(即:隨機變量X的取值小於x=10的概率為50%), x=10.98對應的累積概率為97.5%(即:隨機變量X的取值小於x=10.98的概率為97.5%)。

隨機變量的分布與分位數概念
分位數的概念很重要,我們在研究過程能力時,通常將被研究過程的特性的99.865%分位數與0.135%分位數的差值

(即:被研究過程的特性其中間99.73%的區間范圍)定義為過程變異(Process Variation)的寬度。建立SPC控制圖,

如:均值極差(Xbar-R)控制圖時,也是分別以樣本均值和樣本極差的0.135%分位數和99.865%分位數作為下控制限(LCL)和上控制限(UCL)。

對於服從正態分布的過程的特性X,其0.135%分位數X0.135%=μ-3σ,99.865%分位數X99.865%=μ+ 3σ,因此,過程變異的寬度=6σ。

對於服從任意分布的隨機變量,過程變異的寬度= X99.865% - X0.135%。以下是任意分布時的概率密度分布曲線的例子。

隨機變量取值X=xi時的概率P(X=xi=△xf(x),因為△x趨於0,因此在連續分布中,隨機變量取值X=xi的概率P(X=xi)趨於0。

隨機變量的分布與分位數概念

 


免責聲明!

本站轉載的文章為個人學習借鑒使用,本站對版權不負任何法律責任。如果侵犯了您的隱私權益,請聯系本站郵箱yoyou2525@163.com刪除。



 
粵ICP備18138465號   © 2018-2025 CODEPRJ.COM