常見的概率分布

本文轉載自查看原文 2017-10-14 17:24 2664 deeplearning/ 轉貼

離散分布

0-1分布(伯努利分布)

它的分布律為：

\[P\{X=k\}=p^k(1-p)^{1-k}, k=0,1, (0<p<1)\]

0-1分布記作：\(X \sim b(1,p)\)

期望：\(E(X)=p\)

方差:\(D(X)=p(1-p)\)

常用的場景：新生嬰兒性別的登記，招生考試的錄取，產品的是否合格，硬幣的正反面。

二項分布

二項分布為\(n\)重伯努利實驗的概率分布。

分布律為：

\[P\{X=k\}=\begin{pmatrix}
n\\
k
\end{pmatrix}p^k(1-p)^{n-k},k=0,1,2,...,n,(0<p<1)\]

\[\sum\limits_{k=0}^{n}P\{X=k\}=\sum\limits_{k=0}^{n}\begin{pmatrix}
n\\
k
\end{pmatrix}p^k(1-p)^{n-k}=(p+1-p)^n=1\]

二項分布記作：\( X \sim b(n,p)\)

期望：\(E(X)=np\)

方差:\(D(X)=np(1-p)\)

常用的場景：比如一個人射擊\(n\)次，其中\(k\)次命中的概率，抽查50台設備，其中10台出故障的概率等等。

從下面的圖中，我們可以看到命中次數先增加，到了3達到最大，之后又逐漸減少，一般來說，對於固定的\(n,p\)，都具有這一性質。

（1）當\(（n+1）p\)不為整數時，二項概率\(P\{X=k\}\)在\(k=[(n+1)p]\)時達到最大值；

（2）當\(（n+1）p\)為整數時，二項概率\(P\{X=k\}\)在\(k=(n+1)p,k=(n+1)p-1\)時達到最大值。

%每輪射擊10次，命中概率0.3，射擊10000輪，x中返回的是每輪中命中的次數
x=binornd(10,0.3,10000,1);
%bin的數目為10
hist(x,10);

N=100;
p=0.4;
k=0:N;
%事件發生k次的概率
pdf=binopdf(k,N,p);
%事件發生不大於k次的概率
cdf=binocdf(k,N,p);
plotyy(k,pdf,k,cdf);
grid on;

多項分布

多項式分布是二項式分布的擴展，在多項式分布所代表的實驗中，一次實驗會有多個互斥結果，而二項式分布所代表的實驗中，一次實驗只有兩個互斥結果。

把二項擴展為多項就得到了多項分布。比如扔骰子，不同於扔硬幣，骰子有6個面對應6個不同的點數，這樣單次每個點數朝上的概率都是1/6（對應p1~p6，它們的值不一定都是1/6，只要和為1且互斥即可，比如一個形狀不規則的骰子），重復扔n次，如果問有x次都是點數6朝上的概率就是：

\[C_n^xp^x(1-p)^{n-x}\]

更一般性的問題會問：點數1~6的出現次數分別為(x1,x2,x3,x4,x5,x6)時的概率是多少？其中sum(x1~x6）= n。這就是一個多項式分布問題。這時只需用上邊公式思想累乘約減就會得到下面的概率公式

某隨機實驗如果有\(k\)個可能結局\(A_1,A_2,…,A_k\)，分別將他們的出現次數記為隨機變量\(X_1,X_2,…,X_k\)，它們的概率分布分別是\(p_1,p_2,…,p_k\)，那么在\(n\)次采樣的總結果中，\(A_1\)出現\(n_1\)次、\(A_2\)出現\(n_2\)次、…、\(A_k\)出現\(n_k\)次的這種事件的出現概率P有下面公式：

\[P(X_1=n_1,...,X_k=n_k)=\left\{\begin{matrix}\frac{n!}{n_1!...n_k!}p_1^{n_1}...p_k^{n_k}, \sum\limits_{i=1}^kn_i=n\\ 0, others\end{matrix}\right.\]

用另一種形式寫為：

\[P(X_1=n_1,...,X_k=n_k)=\left\{\begin{matrix} n!\prod\limits_{i=1}^k\frac{p_i^{n_i}}{n_i!}, \sum\limits_{i=1}^kn_i=n\\ 0, others\end{matrix}\right.\]

其中\(\sum\limits_{i=1}^{k}p_i=1\) 。

期望: 設r維隨機變量\((x_1,x_2,⋯,x_r)\)服從多項分布，則數學期望是

\[E(x_1,x_2,⋯,x_n)=(np_1,np_2,⋯,np_r)\]

方差：\(Var(x_i)=np_i(1−p_i)，i=1,2,⋯,r\)

泊松分布

概率分布為：

\[P\{X=k\}=\frac{\lambda^ke^{-\lambda}}{k!},k=0,1,2,...,\lambda>0\]

泊松分布記作：\(X \sim \pi(\lambda)\)

\[\sum\limits_{k=0}^{\infty}P\{X=k\}=\sum\limits_{k=0}^{\infty}\frac{\lambda^ke^{-\lambda}}{k!}=e^{-\lambda}e^\lambda=1,k=0,1,2,...,\lambda>0\]

期望：\(E(X)=\lambda\)

方差:\(D(X)=\lambda\)

常用場景：一天內網站的訪問量，某段時間內發生的交通事故等等。泊松分布適合於描述單位時間（或空間）內隨機事件發生的次數。

對於二項分布，如果\(np_n=\lambda\).可以用泊松分布來近似二項分布。

下面的代碼畫出泊松分布的概率密度圖和分布圖。

x=0:1:20;
%lambda=5,泊松概率密度
y=poisspdf(x,5);
plot(x,y);
%lambda=5,泊松概率分布
y1=poisscdf(x,5);
figure;
plot(x,y1);

負二項分布(帕斯卡分布)

進行重復試驗時，直到某個事件出現了\(r\)次時停止試驗，此時試驗進行次數\(X\)服從負二項分布，為二項分布的變體，注意到最后一次一定是成功的，所以是\(C_{k-1}^{r-1}\)而不是\(C_k^r\)

概率分布為：

\[P\{X=k\}=C_{k-1}^{r-1}p^r(1-p)^{k-r},k=r+1,r+2,...,n,(0<p<1)\]

負二項分布記作：\( X \sim b_0(r,p)\)

期望：\(E(X)=\frac{r}{p}\)

方差:\(D(X)=\frac{r(1-p)}{p^2}\)

常用的場景：比如抽查20台設備，如果出現3次失敗就停止抽查，全面停工。

幾何分布

負二項分布中，r=1時的特殊情況，即第1次試驗成功時，試驗進行的次數X的分布。

概率分布為：

\[P\{X=k\}=p(1-p)^k,k=0,1,...,n,(0<p<1)\]

負二項分布記作：\( X \sim b_0(r,p)\)

期望：\(E(X)=\frac{1}{p}\)

方差:\(D(X)=\frac{(1-p)}{p^2}\)

常用的場景：比如抽查20台設備，如果設備故障，立即停工檢修。

超幾何分布

to do

單點分布(退化分布)

隨機變量取a時，概率為1。

記作： \(b_0(a,1)\)

單點分布記作：\(p(x=a)=1\)

期望：a

方差：0

連續分布

均勻分布

隨機變量的概率密度在[a,b]區間上為常數\(\frac{1}{b-a}\)，則此隨機變量服從均勻分布，意為在某個區間內各取值是等可能的，概率的大小只與長度有關。

均勻分布概率密度函數：

\[f(x)=\left\{\begin{matrix}
\frac{1}{b-a}, a<x<b\\
0, others
\end{matrix}\right.\]

均勻分布分布函數：

\[F(x)=\left\{\begin{matrix} 0, x<a\\
\frac{x-a}{b-a}, a \leq x<b\\
1, x \geq b
\end{matrix}\right.\]

均勻分布記作: \( U(a,b)\)

期望:\(E(X)=\frac{(a+b)}{2}\)

方差：\(D(X)=\frac{(b-a)^2}{12}\)

正態分布(高斯分布)

http://www.cnblogs.com/mikewolf2002/p/7669977.html

指數分布

為伽瑪分布的特殊形式，即當\(\alpha=1\)時的伽瑪分布。

均勻分布概率密度函數：

\[f(x)=\left\{\begin{matrix}
\frac{1}{\theta}e^{-x/\theta}, x>0\\
0, others
\end{matrix}\right.\]

均勻分布分布函數：

\[F(x)=\left\{\begin{matrix} 1-e^{-x/\theta}, x>0\\
0, others
\end{matrix}\right.\]

均勻分布記作: \(\Gamma(a,b)\)

期望:\(E(X)=\theta\)

方差：\(D(X)=\theta^2\)

指數函數的一個重要特征是無記憶性（Memoryless Property，又稱遺失記憶性）。這表示如果一個隨機變量呈指數分布，當\(s,t>0\)時有\(P(T>t+s|T>t)=P(T>s)\)。即，如果\(T\)是某一元件的壽命，已知元件使用了\(t\)小時，它總共使用至少\(s+t\)小時的條件概率，與從開始使用時算起它使用至少\(s\)小時的概率相等。

用下面的代碼，我們可以畫出指數分布的概率密度函數和分布函數圖：

x=0:0.1:5;
plot(x,[gampdf(x,1,0.3);gampdf(x,1,1);gampdf(x,1,2)]);
legend('theta=0.3','theta=1','theta=2');
grid on;
figure;
plot(x,[gamcdf(x,1,0.3);gamcdf(x,1,1);gamcdf(x,1,2)]);
legend('theta=0.3','theta=1','theta=2');
grid on;

\(\Gamma 分布\)(伽馬分布)

http://www.cnblogs.com/mikewolf2002/p/7664944.html

\(\chi^2\)分布(卡方分布)

http://www.cnblogs.com/mikewolf2002/p/7664944.html

t分布(學生氏分布)

to do

非中心t分布

to do

F分布

to do

非中心F分布

to do

對數正態分布

to do

逆高斯分布

to do

非中心\(\chi^2\)分布

to do

韋布爾分布

to do

拉普拉斯分布

to do

瑞利分布

to do

帕雷托分布

to do

極值分布

to do

邏輯斯諦分布

to do

B分布(貝塔分布)

to do

柯西分布

to do

免責聲明！

本站轉載的文章為個人學習借鑒使用，本站對版權不負任何法律責任。如果侵犯了您的隱私權益，請聯系本站郵箱yoyou2525@163.com刪除。

猜您在找 常見的概率分布概率論-常見的概率分布模型常見離散型變量概率分布常見概率分布及python實現常見離散和連續概率分布 B-概率論-常見的概率分布模型概率分布匯總概率筆記5——概率分布概率分布的轉換概率分布