通俗易懂理解指數分布


通俗易懂理解指數分布

一、總結

一句話總結:

賣包子的時間間隔符合 指數分布
本例中指數分布的意義:如果知道這個時間間隔,老板也好調整自己的服務員人數(時間間隔短,那么需要的服務人員就多,反之需要的就少),優化成本結構。

 

1、當λ較小的時候,比如說λ=1吧,也就是說一天只賣出一個饅頭,那么饅頭賣出間隔時間大於1的可能性就很大(下圖是指數分布的概率密度函數的圖像,對應的概率是曲線下面積)?

而如果λ較大的時候,比如說λ=3吧,也就是說一天賣出三個饅頭,【】那么饅頭賣出間隔時間大於1的可能性已經變得很小了】:

 

 

2、每日賣出饅頭的數目X服從泊松分布,賣出饅頭的時間間隔Y服從指數分布?

【倒數關系】:他們的期望分別為:$$E ( X ) = \lambda , \quad E ( Y ) = \frac { 1 } { \lambda }$$
【倒數關系】:根據之前的分析就比較好理解了,E(X)的含義是平均每日賣出的饅頭數,而E(Y)是每個饅頭之間賣出的平均時間間隔,所以兩者是倒數關系:每日賣出的越多自然間隔時間越短,每日賣出的越少自然間隔時間越長。

 

 

 

二、通俗易懂理解指數分布(轉)

轉自:https://www.matongxue.com/madocs/2104/

 

指數分布和泊松分布息息相關,所以先簡單回憶下之前介紹過的泊松分布。公司樓下有家饅頭店,每天早上六點到十點營業:

馬同學高等數學

老板統計了一周每日賣出的饅頭(為了方便計算和講解,縮小了數據),想從中找到一些規律:


\begin{array}{c|c}
    \qquad\qquad&\qquad銷售\qquad\\
    \hline\color{SkyBlue}{周一}& 3 \\
    \hline \color{blue}{周二}& 7 \\
    \hline \color{orange}{周三}&4\\
    \hline \color{Goldenrod}{周四}&6\\
    \hline \color{green}{周五}&5\\
\end{array}

從中可以得到最簡單的規律,均值:

\overline{X}=\frac{3+7+4+6+5}{5}=5

這個規律顯然不夠好,如果把營業時間抽象為一根線段,把這段時間用T來表示:

馬同學高等數學

然后把賣出的饅頭數畫在這根線段上(節約篇幅,只畫出周一周二作為示意),可以看到每天賣出的饅頭起伏還是很大的:

馬同學高等數學
馬同學高等數學

經過老板一系列的騷操作(更具體的推導請看如何理解泊松分布),最后得到每日賣出的饅頭數X服從泊松分布:

X\sim P(\lambda),\quad \lambda=\overline{X}

泊松分布的具體表達式為:

P(X=k)=\frac{\lambda^k}{k!}e^{-\lambda}

據此可以畫出每日賣出饅頭數的概率分布,這個規律就比均值要精細很多了:

馬同學高等數學

2 饅頭賣出之間的時間間隔

下面來討論另外一個問題,饅頭賣出之間的時間間隔:

馬同學高等數學

可以看出也是隨機變量(也就是圖中的T_1、T_2、T_3、\cdots),不過相對饅頭賣出個數而言,時間間隔肯定是連續的隨機變量。

如果知道這個時間間隔,老板也好調整自己的服務員人數(時間間隔短,那么需要的服務人員就多,反之需要的就少),優化成本結構。那么問題來了,這個時間間隔服從什么分布?

3 一天的間隔

既然都是賣饅頭的問題,那么還是讓我們從已知的泊松分布上想想辦法。之前得到的泊松分布讓我們知道了每天賣出的饅頭數,所以下面按天來分析看看。

假如某一天沒有賣出饅頭,比如說周三吧,這意味着,周二最后賣出的饅頭,和周四最早賣出的饅頭中間至少間隔了一天:

馬同學高等數學

當然也可能運氣不好,周二也沒有賣出饅頭。那么賣出兩個饅頭的時間間隔就隔了兩天,但無論如何時間間隔都是大於一天的:

馬同學高等數學

而某一天沒有賣出饅頭的概率可以由泊松分布得出:

P(X=0)=\frac{\lambda^0}{0!}e^{-\lambda}=e^{-\lambda}

根據上面的分析,賣出兩個饅頭之間的時間間隔要大於一天,那么必然要包含沒有賣出饅頭的這天,所以兩者的概率是相等的。如果假設隨機變量為:

Y=賣出兩個饅頭之間的時間間隔

那么就有:

P(Y > 1)=P(X=0)=e^{-\lambda}

4 泊松過程

之前求出的泊松分布實在限制太大,只告訴了我們每天賣出的饅頭數。不過沒有關系,稍微擴展下可以得到新的函數:

P(X=k,t)=\frac{\left(\lambda t\right)^k}{k!}e^{-\lambda t}

通過新的這個函數就可知不同的時間段內賣出的饅頭數的分布了(t=1時就是泊松分布):


\begin{array}{c|c}
    \hline
    \quad \quad &\quad t\quad&\quad PDF\quad\\
    \hline
    \\
    每天賣出的饅頭數 & 1 & P(X=k,1)=\frac{\lambda^k}{k!}e^{-\lambda}\\
    半天賣出的饅頭數 & \frac{1}{2} & P(X=k,\frac{1}{2})=\frac{\left(\frac{1}{2}\lambda\right)^k}{k!}e^{-\frac{1}{2}\lambda}\\
    三小時賣出的饅頭數 & \frac{1}{8} & P(X=k,\frac{1}{8})=\frac{\left(\frac{1}{8}\lambda\right)^k}{k!}e^{-\frac{1}{8}\lambda}\\
    \\
    \hline
\end{array}

擴展后得到的函數稱為\color{Salmon}{泊松過程},這里涉及到比較復雜的知識,就不做推導了,感興趣的同學可以自行根據關鍵字擴展學習。

5 指數分布

兩次賣出饅頭之間的時間間隔大於t的概率,根據之前的分析,等同於t時間內沒有賣出一個饅頭的概率,而后者的概率可以由泊松過程給出。至此所需的條件都齊備了,那么開始解題吧,假設隨機變量:

Y=兩次賣出饅頭之間的時間間隔

這個隨機變量的概率可以如下計算:

P(Y > t)=P(X=0, t)=\frac{\left(\lambda t\right)^0}{0!}e^{-\lambda t}=e^{-\lambda t},\quad t \ge 0

進而有:

P(Y \le t)=1-P(Y > t)=1-e^{-\lambda t}

這其實已經得到了Y的累積分布函數了:


F(y)=P(Y \le y)=\begin{cases}
1-e^{-\lambda y}, & y \ge 0\\
0,& y < 0
\end{cases}

對其求導就可以得到概率密度函數:


p(y)=\begin{cases}
\lambda e^{-\lambda y}, & y \ge 0\\
0,& y < 0
\end{cases}

這就是賣出饅頭的時間間隔Y的概率密度函數,也稱為\color{Salmon}{指數分布}

6 指數分布的圖像

指數分布中的\lambda是每日平均賣出的饅頭數,如果\lambda越大,也就是說每日賣出的饅頭越多,那么兩個饅頭之間的時間間隔必然越短,這點從圖像上也可以看出。

\lambda較小的時候,比如說\lambda=1吧,也就是說一天只賣出一個饅頭,那么饅頭賣出間隔時間大於1的可能性就很大(下圖是指數分布的概率密度函數的圖像,對應的概率是曲線下面積):

馬同學高等數學

而如果\lambda較大的時候,比如說\lambda=3吧,也就是說一天賣出三個饅頭,那么饅頭賣出間隔時間大於1的可能性已經變得很小了:

馬同學高等數學

7 泊松分布與指數分布的期望

每日賣出饅頭的數目X服從泊松分布,賣出饅頭的時間間隔Y服從指數分布:

X\sim P(\lambda),\quad Y\sim Exp(\lambda)

他們的期望分別為:

E(X)=\lambda,\quad E(Y)=\frac{1}{\lambda}

根據之前的分析就比較好理解了,E(X)的含義是平均每日賣出的饅頭數,而E(Y)是每個饅頭之間賣出的平均時間間隔,所以兩者是倒數關系:每日賣出的越多自然間隔時間越短,每日賣出的越少自然間隔時間越長。

8 小結

還有未盡的一些解釋,比如:

  • 為什么指數分布常常用來描述電器壽命?
  • 為什么指數分布和幾何分布一樣具有無記憶性?
 


免責聲明!

本站轉載的文章為個人學習借鑒使用,本站對版權不負任何法律責任。如果侵犯了您的隱私權益,請聯系本站郵箱yoyou2525@163.com刪除。



 
粵ICP備18138465號   © 2018-2025 CODEPRJ.COM