多元統計分析:典型習題


對課后習題的一些整理,由於不知道多元統計分析考試的內容,只能隨便整理一些。如果有錯誤,請在評論區中指出。

第一題:條件分布與獨立性

條件分布與獨立性 一、設\(X\sim N_3(\mu,\Sigma)\),其中

\[\mu=\begin{bmatrix} \mu_1 \\ \mu_2 \\ \mu_3 \end{bmatrix},\Sigma=\begin{bmatrix} 1 & \rho & \rho \\ \rho & 1 & \rho \\ \rho & \rho & 1 \end{bmatrix}. \]

(1)求條件分布\((X_1,X_2|X_3)\);(2)給定\(X_3=x_3\)時,寫出\(X_1,X_2\)的條件協方差。

解:(1)多元正態分布的條件分布依然是正態分布,所以\((X_1,X_2|X_3)\sim N_2(\mu_{12\cdot 3},\Sigma_{12\cdot 3})\),這里

\[\mu_{12\cdot 3}=\begin{bmatrix} \mu_1 \\ \mu_2 \end{bmatrix}+\begin{bmatrix} \rho \\ \rho \end{bmatrix}(X_3-\mu_3)=\begin{bmatrix} \mu_1+\rho(X_3-\mu_3) \\ \mu_2+\rho(X_3-\mu_3) \end{bmatrix},\\ \Sigma_{12\cdot 3}=\begin{bmatrix} 1 & \rho \\ \rho & 1 \end{bmatrix}-\begin{bmatrix} \rho^2 & \rho^2 \\ \rho^2 & \rho^2 \end{bmatrix}=\begin{bmatrix} 1-\rho^2 & \rho-\rho^2 \\ \rho-\rho^2 & 1-\rho^2 \end{bmatrix}. \]

(2)由其條件分布得,

\[{\rm Cov}(X_1,X_2|X_3)=\rho-\rho^2. \]


第二題:正態分布

正態分布的線性組合 二、設\(X\sim N_3(\mu,\Sigma)\),這里\(X=(X_1,X_2,X_3)'\)\(\mu=(2,-3,1)'\)

\[\Sigma=\begin{bmatrix} 1 & 1 & 1 \\ 1 & 3 & 2 \\ 1& 2 & 2 \end{bmatrix}. \]

(1)求\(3X_1-2X_2+X_3\)的分布;(2)求\(a=(a_1,a_2)'\)使得\(X_3\)\((X_1,X_2)'-aX_3\)相互獨立。(3)已知\(X_2,X_3\)的觀測值分別為\(x_2,x_3\),求\(X_1\)的最佳線性預測。

解:(1)設\(c=(3,-2,1)'\),則

\[c'X\sim N(c'\mu,c'\Sigma c), \]

代入得到\(3X_1-2X_2+X_3\sim N(13,9)\)

(2)這里

\[a=\begin{bmatrix} 1 \\ 2 \end{bmatrix}2^{-1}=\begin{bmatrix} \frac{1}{2} \\ 1 \end{bmatrix}. \]

(3)最佳線性預測即\(\mu_{1\cdot 23}\),而

\[\mu_{1\cdot 23}=\mu_1+\Sigma_{1,23}\Sigma_{23}^{-1}\begin{bmatrix} x_2-\mu_2 \\ x_3-\mu_3 \end{bmatrix}=\frac{1}{2}x_3+\frac{1}{2}. \]


第三題:均值檢驗

均值的似然比檢驗 三、設單個\(p\)元總體\(N_p(\mu,\Sigma)\)的均值向量檢驗問題,使用似然比原理導出檢驗\(H_0:\mu=\mu_0\)的似然比統計量以及分布,設\(\Sigma=\Sigma_0\)已知。

解:似然函數為

\[L(\mu)=\frac{1}{(2\pi)^{np/2}|\Sigma_0|^{n/2}}\exp\left(-\frac{1}{2}\sum_{i=1}^n(x_i-\mu)'\Sigma^{-1}_0(x_i-\mu) \right), \]

故似然比統計量為

\[\begin{aligned} \lambda=& \frac{L(\mu_0)}{L(\bar X)} \\ =& \exp\left\{\frac{1}{2}\sum_{i=1}^n[(x_i-\bar X)'\Sigma_0^{-1}(x_i-\bar X)-(x_i-\mu_0)'\Sigma_0^{-1}(x_i-\mu_0) ]\right\}\\ =&\exp\left\{-n\bar X'\Sigma_0^{-1}(\bar X-\mu_0)+\frac{n}{2}(\bar X-\mu_0)'\Sigma_{0}^{-1}(\bar X-\mu_0) \right\}\\ =&\exp\left\{-\frac{n}{2}(\bar X-\mu_0)'\Sigma_0^{-1}(\bar X-\mu_0) \right\}. \end{aligned} \]

也就是

\[-2\ln \lambda=(\bar X-\mu_0)'\left(\frac{\Sigma_0}{n}\right)^{-1}(\bar X-\mu_0). \]

由於

\[\bar X-\mu_0\sim N_p\left(0,\frac{\Sigma_0}{n}\right). \]

由多元正態分布的二次型分布,得到\(-2\ln \lambda\sim \chi^2(p)\)


第四題:均值結構檢驗

均值向量分量檢驗 四、設\(X\sim N_p(\mu,\Sigma)\),這里\(\Sigma>0\)未知,記\(\mu=(\mu_1,\cdots,\mu_p)\)\(C\)\(k\times p\)常數矩陣且\({\rm rank}(C)=k\),給出檢驗\(H_0:C\mu=r\)的檢驗統計量與分布。

解:\(CX\sim N_p(C\mu,C\Sigma C')\),即轉化為均值向量未知時的假設檢驗。由於

\[\bar X\sim N_p\left(\mu,\frac{\Sigma}{n}\right),\quad A\sim W_p(n-1,\Sigma), \]

所以

\[\sqrt{n}C(\bar X-\mu)\sim N_k(0,C\Sigma C'),\quad CAC'\sim W_k(n-1,C\Sigma C'), \]

構造

\[T^2\xlongequal{def}n(C\bar X-r)'\left(\frac{CAC'}{n-1} \right)^{-1}(C\bar X-r)\sim T^2(k,n-1). \]

即可利用\(T^2\)分布構造檢驗統計量。

本題給出的結論,可以研究均值內部結構的檢驗。


第五題:均值結構檢驗實例

均值的結構檢驗 五、假定某總體的三個變量\((X_1,X_2,X_3)\)有這樣的規律:\(X_1:X_2:X_3=6:4:1\)。從總體\(X\)中抽取出\(6\)個樣本,算得

\[\bar X=\begin{bmatrix} 82.0 \\ 60.2 \\ 14.5 \end{bmatrix},\quad A=\begin{bmatrix} 158.0 & 40.2 & 2.5 \\ 40.2 & 15.86 & 6.55 \\ 2.5 & 6.55 & 9.5 \end{bmatrix}, \]

檢驗這個規律是否真的存在。

解:定義結構矩陣為

\[C\xlongequal{def}\begin{bmatrix} -1 & 0 & 6 \\ 0 & -1 & 4 \end{bmatrix}, \]

\(H_0:C\mu=0\),按照上題的方式構造檢驗統計量為

\[T_0^2=6(C\bar X)'\left(\frac{CAC}{5} \right)^{-1}(C\bar X)=47.1434, \]

如果\(H_0\)成立,則\(T^2\sim T^2(2,5)\),結合\(F\)統計量與\(T\)統計量的關系,有

\[F=\frac{2}{5}T^2\sim F(2,4),F_0=18.857. \]

\(F\)分布表得到\(F_{0.01}=18\),所以\(F_0>F_{0.01}\),應當拒絕原假設,認為這個規律不存在。


第六題:協方差陣檢驗

協方差的似然比檢驗:六、對單個正態總體\(N_p(\mu,\Sigma)\),使用似然比檢驗導出\(H_0:\Sigma=\Sigma_0\)的似然比統計量及其分布,這里\(\mu\)未知。

解:似然比統計量為

\[\begin{aligned} \lambda=&\frac{L(\bar X,\Sigma_0)}{L(\bar X,\frac{A}{n})}\\ =&\left(\frac{|\frac{A}{n}|}{|\Sigma_0|}\right)^{n/2}\exp\left(-\frac{1}{2}\sum_{i=1}^n[(x_i-\bar X)'\Sigma_0^{-1}(x_i-\bar X)-(x_i-\bar X)'(\frac{A}{n})^{-1}(x_i-\bar X)] \right)\\ =&\left(\frac{|\frac{A}{n}|}{|\Sigma_0|} \right)^{n/2}{\rm etr}\left[-\frac{1}{2}\left(\Sigma^{-1}_0-(\frac{A}{n})^{-1} \right)A \right]\\ =&\left(\frac{|\frac{A}{n}|}{|\Sigma_0|} \right)^{n/2}{\rm etr}\left(-\frac{1}{2}\Sigma_0^{-1}A+nI_p \right)\\ =&\left(\frac{e}{n} \right)^{np/2}|\Sigma_0^{-1}A|^{n/2}{\rm etr}\left(-\frac{1}{2}\Sigma_0^{-1}A \right). \end{aligned} \]

由Wilks定理,能夠導出似然比統計量的極限分布為

\[-2\ln \lambda\stackrel {d}\to \chi^2\left(\frac{p(p+1)}{2} \right). \]


第七題:距離判別

線性判別函數 七、考慮兩個數據集:

\[X_1=\begin{bmatrix} 3 & 7 \\ 2 & 4 \\ 4 & 7 \end{bmatrix},X_2=\begin{bmatrix} 6 & 9 \\ 5 & 7 \\ 4 & 8 \end{bmatrix}, \]

計算線性判別函數,並給出訓練集上的判斷准確率。

解:計算兩個數據集的數字特征,為

\[\bar X_1=\begin{bmatrix} 3 \\ 6 \end{bmatrix},\quad \bar X_2=\begin{bmatrix} 5 \\ 8 \end{bmatrix},\quad S_{\text{pooled}}=\begin{bmatrix} 1 & 1 \\ 1 & 2 \end{bmatrix}, \]

計算線性判別函數為

\[W(x)=(x-\frac{1}{2}(\bar X_1+\bar X_2))'S^{-1}(\bar X_1-\bar X_2)=8-2x_1, \\ x\in:\left\{\begin{array}l X_1,& \text{if }W(x)>0; \\ X_2,& \text{if }W(x)\le 0. \end{array}\right. \]

在此線性判別函數下,\(X_1\)的三個樣本中兩個判斷正確,一個判斷錯誤,\(X_2\)的三個樣本全部判斷正確。


第八題:貝葉斯判別

貝葉斯判別 八、設有兩個二元正態總體\(G_1,G_2\),相關數字特征如下:

\[\mu_{(1)}=\begin{bmatrix} 10 \\ 15 \end{bmatrix},\mu_{(2)}=\begin{bmatrix} 20 \\ 25 \end{bmatrix},\\ \Sigma_{\text{pooled}}=\begin{bmatrix} 18 & 12 \\ 12 & 32 \end{bmatrix}. \]

如果先驗概率\(q_1=q_2\),錯判損失為\(L(2|1)=10\)\(L(1|2)=75\),則以下兩個樣品應當如何歸類?

\[X_{(1)}=\begin{bmatrix} 20 \\ 20 \end{bmatrix},X_{(2)}=\begin{bmatrix} 15 \\ 20 \end{bmatrix}. \]

解:貝葉斯判別使得平均損失最小,將樣本\(X\)判定給\(G_1\)\(G_2\)的損失分別是

\[h_1(X)=q_2f_2(X)L(1|2)=75q_2f_2(X),\\ h_2(X)=q_1f_1(X)L(2|1)=10q_1f_1(X). \]

分別取其對數,有

\[\ln h_1(X)=C-\frac{1}{2}(X-\mu_{(2)})'\Sigma_{\text{pooled}}^{-1}(X-\mu_{(2)})+\ln75,\\ \ln h_2(X)=C-\frac{1}{2}(X-\mu_{(1)})'\Sigma_{\text{pooled}}^{-1}(X-\mu_{(1)})+\ln10. \]

計算得

\[h_1(X_{(1)})=C+\ln(75)-\frac{25}{48},\quad h_2(X_{(1)})=C+\ln(10)-\frac{1225}{432}. \]

因為\(h_1(X_{(1)})>h_2(X_{(1)})\),所以應該把\(X_{(1)}\)歸為\(G_2\)。或者直接計算

\[\frac{h_2(X)}{h_1(X)}=\frac{10f_1(X)}{75f_2(X)}=\frac{2}{25}\exp\left\{(\mu_{(1)}-\mu_{(2)})'\Sigma_{\text{pooled}}^{-1}\left[X-\frac{1}{2}(\mu_{(1)}+\mu_{(2)}) \right] \right\}. \]

\(X_{(2)}\)代入計算,得到

\[\frac{h_2(X_{(2)})}{h_1(X_{(1)})}=\frac{2}{25}<1,\quad h_2(X_{(2)})<h_{1}(X_{(2)}), \]

所以應該把\(X_{(2)}\)判為\(G_2\)


第九題:費希爾判別

費希爾判別 九、設有兩個二元正態總體\(G_1,G_2\),相關數字特征如下:

\[\mu_{(1)}=\begin{bmatrix} 10 \\ 15 \end{bmatrix},\mu_{(2)}=\begin{bmatrix} 20 \\ 25 \end{bmatrix},\\ \Sigma_1=\begin{bmatrix} 18 & 12 \\ 12 & 32 \end{bmatrix},\Sigma_2=\begin{bmatrix} 20 & -7 \\ -7 & 5 \end{bmatrix}. \]

使用Fisher判別法,對以下兩個樣品歸類:

\[X_{(1)}=\begin{bmatrix} 20 \\ 20 \end{bmatrix},X_{(2)}=\begin{bmatrix} 15 \\ 20 \end{bmatrix}. \]

解:由於此時沒有樣本,我們就取\(\bar \mu=\frac{1}{2}(\mu_{(1)}+\mu_{(2)})\)

\[A=\Sigma_1+\Sigma_2=\begin{bmatrix} 38 & 5 \\ 5 & 37 \end{bmatrix},\\ B=(\mu_{(1)}-\bar\mu)'(\mu_{(1)}-\bar \mu)+(\mu_{(2)}-\bar \mu)'(\mu_{(2)}-\bar \mu)=\begin{bmatrix} 50 & 50 \\ 50 & 50 \end{bmatrix}. \]

所以

\[A^{-1}B=\frac{1}{d}\begin{bmatrix} 32 & 32 \\ 33 & 33 \end{bmatrix}, \]

其最大特征值對應的特征向量為\(a=(32,33)'\)。設\(\nu_{(1)}=a'\mu_{(1)}\)\(\nu_{(2)}=a'\mu_{(2)}\)\(\sigma_1=a'\Sigma_1a\)\(\sigma_2=a'\Sigma_2a\)\(u_{(1)}=a'X_{(1)}\)\(u_{(2)}=a'X_{(2)}\),則

\[\nu_{(1)}=815,\quad \nu_{(2)}=1465,\\ \sigma_1=78624,\quad \sigma_2=11141;\\ u_{(1)}=1300,\quad u_{(2)}=1140. \]

計算其馬氏距離,有

\[d_1(u_{(1)})=\frac{|1300-815|}{\sqrt{78624}}=1.730,\\ d_2(u_{(1)})=\frac{|1300-1465|}{\sqrt{11141}}=1.563;\\ d_1(u_{(2)})=\frac{|1140-815|}{\sqrt{78624}}=1.159;\\ d_2(u_{(2)})=\frac{|1140-1465|}{\sqrt{11141}}=-3.079. \]

所以\(u_{(1)}\)應該歸為\(G_2\)\(u_{(2)}\)都應該歸為\(G_1\)


第十題:類平均法聚類

系統聚類 十、用類平均法作系統聚類,距離陣如下。

\[D^{(0)}=\begin{bmatrix} 0 & \\ 4 & 0 \\ 6 & 9 & 0 \\ 1 & 7 & 10 & 0 \\ 6 & 3 & 5 & 8 & 0 \end{bmatrix}. \]

解:類平均法的距離遞推公式為

\[D_{rk}^2=\frac{n_p}{n_r}D^2_{pk}+\frac{n_q}{n_r}D_{qk}^2. \]

第一次聚類,將樣本1和4歸為一類,記作\(CL_1=(1,4)\),第一層高度為1。

\[d^2(CL_1,2)=\frac{1}{2}(16+49)=32.5,\\ d^2(CL_1,3)=\frac{1}{2}(36+100)=68,\\ d^2(CL_1,5)=\frac{1}{2}(36+64)=50. \]

此時的距離矩陣(平方)為

\[D^2_{(1)}=\begin{matrix} CL_1 \\ 2 \\ 3 \\ 5 \end{matrix}\begin{bmatrix} 0 \\ 32.5 & 0 \\ 68 & 81 & 0\\ 50 & 9 & 25 & 0 \end{bmatrix}. \]

第二次聚類,將樣品2和5歸為一類,記作\(CL_2=(2,5)\),第二層高度為3。

\[d^2(CL_2,CL_1)=\frac{1}{2}(32.5+50)=41.25,\\ d^2(CL_2,3)=\frac{1}{2}(81+25)=53,\\ \]

此時的距離矩陣(平方)為

\[D_{(2)}^{2}=\begin{matrix} CL_1 \\ CL_2 \\ 3 \end{matrix}\begin{bmatrix} 0 \\ 41.25 & 0 \\ 68 & 53 & 0 \end{bmatrix}. \]

第三次聚類,將CL1和CL2歸為一類,記作\(CL_3=(1,4,2,5)\),第三層高度為\(\sqrt{41.25}\)

\[d^2(CL_3,3)=\frac{1}{2}(68+53)=60.5. \]

此時的距離矩陣(平方)為

\[D_{(3)}^2=\begin{matrix} CL_3 \\ 3 \end{matrix}\begin{bmatrix} 0 \\ 60.5 & 0 \end{bmatrix} \]

第四次聚類,將所有樣本歸為一類,第四層高度為\(\sqrt{60.5}\)。譜系聚類圖為

image-20210124224442935

第十一題:主成分分析

主成分分析 十一、設隨機向量\(X\)的協方差陣是

\[\Sigma=\begin{bmatrix} 4 & 3 & 2 & 1 \\ 3 & 4 & 1 & 2 \\ 2 & 1 & 4 & 3 \\ 1 & 2 & 3 & 4 \end{bmatrix}, \]

試求\(X\)的主成分,在0.7的總體貢獻率要求下,求需要的主成分個數,並求出這些主成分對\(X_2\)的貢獻率。

解:求\(\Sigma\)的特征值有

\[\lambda_1=10,\lambda_2=4,\lambda_3=2,\lambda_4=0, \]

所以只需要取2個主成分即可,對應的單位特征向量為

\[a_1=\frac{1}{2}(1,1,1,1)',\quad a_2=\frac{1}{2}(1,1,-1,-1)'. \]

所以主成分為

\[Z_1=\frac{1}{2}(X_1+X_2+X_3+X_4),\\ Z_2=\frac{1}{2}(X_1+X_2-X_3-X_4). \]

\[\rho(Z_1,X_2)=\frac{{\rm Cov}(Z_1,X_2)}{\sqrt{\mathbb{D}(Z_1)\mathbb{D}(X_2)}}=\frac{5}{\sqrt{10\cdot 4}}=\frac{\sqrt{10}}{4},\\ \rho(Z_2,X_2)=\frac{{\rm Cov}(Z_2,X_2)}{\sqrt{\mathbb{D}(Z_2)\mathbb{D}(X_2)}}=\frac{1}{2}. \]

這里也可以利用

\[\rho(Z_1,X_2)=\frac{\sqrt{\lambda_1}a_1'e_2}{\sqrt{\mathbb{D}(X_2)}}=\frac{\sqrt{10}}{4} \]

來算,更快。

所以前2個主成分對\(X_2\)的貢獻為

\[\nu_2^{(2)}=\rho^2(Z_1,X_2)+\rho^2(Z_2,X_2)=\frac{7}{8}. \]


第十二題:因子模型

因子模型 十二、設標准化變量\(X_1,X_2,X_3\)的相關陣為

\[R=\begin{bmatrix} 1.00 & 0.63 & 0.45 \\ 0.63 & 1.00 & 0.35 \\ 0.45 & 0.35 & 1.00 \end{bmatrix}, \]

(1)求\(m=2\)的主成分解,並計算因子\(F_1\)的貢獻與\(X_2\)的共同度,計算因子模型的殘差平方和。

(2)已知標准化后的樣本\(X=(0.4, 0.5, 0.6)'\),求其巴特萊特因子得分與湯普森因子得分。

解:(1)\(R\)的特征值為

\[\lambda_1=1.9633,\quad \lambda_2=0.6795, \]

對應單位正交向量為

\[a_1=\begin{bmatrix} -0.625 \\ -0.593 \\ -0.507 \end{bmatrix},a_2=\begin{bmatrix} 0.219 \\ 0.491 \\ -0.873 \end{bmatrix}. \]

所以

\[A=(\sqrt{\lambda_1}a_1,\sqrt{\lambda_2}a_2)=\begin{bmatrix} -0.876 & 0.180 \\ -0.831 & 0.405 \\ -0.711 & -0.695 \end{bmatrix}. \]

此時

\[AA'=\begin{bmatrix} 0.800 & 0.800 & 0.498 \\ 0.800 & 0.855 & 0.309 \\ 0.498 & 0.309 & 0.989 \end{bmatrix},D=\begin{bmatrix} 0.200 \\ & 0.145 \\ & &0.011 \end{bmatrix}. \]

因子\(F_1\)的貢獻為\(q_1^2=1.963\),變量\(X_2\)的共同度為\(h_2^2=0.855\)。此時

\[R-(AA'+D)=\begin{bmatrix} 0 & -0.171 & -0.048 \\ -0.171 & 0 & 0.041 \\ -0.048 & 0.041 & 0 \end{bmatrix},\quad Q=0.066. \]

(2)使用加權最小二乘法計算巴特萊特因子得分,有

\[\hat F=(A'A)^{-1}A'X=\begin{bmatrix} -0.607 \\ -0.210 \end{bmatrix}, \]

或者使用不加權最小二乘法計算因子得分,有

\[\hat F=(A'D^{-1}A)^{-1}A'D^{-1}X=\begin{bmatrix} -0.627 \\ -0.220 \end{bmatrix} \]

使用回歸法計算湯普森因子得分,有

\[\hat F=A'R^{-1}X=\begin{bmatrix} -0.607 \\ -0.210 \end{bmatrix}. \]

可以看到,巴特萊特因子得分與湯普森因子得分幾乎一致。


第十三題:典型相關分析

典型相關分析特例 十三、已知標准化變量的相關陣為

\[R=\begin{bmatrix} R_{11} & R_{12} \\ R_{21} & R_{22} \end{bmatrix}=\begin{bmatrix} 1 & \alpha & \beta & \beta \\ \alpha & 1 & \beta & \beta \\ \beta & \beta & 1 & \nu \\ \beta & \beta & \nu & 1 \end{bmatrix}. \]

\(X,Y\)的典型相關變量與典型相關系數。

解:先計算\(R_{11}\)\(R_{22}\)的逆:

\[R_{11}^{-1}=\frac{1}{1-\alpha^2}\begin{bmatrix} 1 & -\alpha \\ -\alpha & 1 \end{bmatrix},\quad R_{22}^{-1}=\frac{1}{1-\nu^2}\begin{bmatrix} 1 & -\nu \\ -\nu & 1 \end{bmatrix} \]

所以

\[R_{11}^{-1}R_{12}R_{22}^{-1}R_{21}=R_{22}^{-1}R_{21}R_{11}^{-1}R_{12}=\frac{2\beta^2}{(1+\alpha)(1+\nu)}\begin{bmatrix} 1 & 1 \\ 1 & 1 \end{bmatrix}, \]

於是

\[\lambda_1^2=\frac{4\beta^2}{(1+\alpha)(1+\nu)},\quad \lambda_2^2=0. \]

對應於\(\lambda_1\)的特征向量為\((1,1)'\),故\(a_1=x(1,1)',b_1=y(1,1)'\),由\(a_1'R_{11}a_1=1\)\(b_1'R_{22}b_1=1\)得到

\[x=\frac{1}{\sqrt{2(1+\alpha)}},\quad a_1=\frac{1}{\sqrt{2(1+\alpha)}}\begin{bmatrix} 1 \\ 1 \end{bmatrix};\\ y=\frac{1}{\sqrt{2(1+\nu)}},\quad b_1=\frac{1}{\sqrt{2(1+\nu)}}\begin{bmatrix} 1 \\ 1 \end{bmatrix}. \]

典型相關變量為\(a_1X\)\(b_1Y\),典型相關系數為

\[\rho_1=\frac{2\beta}{\sqrt{(1+\alpha)(1+\nu)}}. \]


第十四題:典型相關分析實例

樣本典型相關 十四、設標准化變量構成的相關系數陣為

\[R=\begin{bmatrix} 1.0 & 0.5 & 0.7 & 0.7 \\ 0.5 & 1.0 & 0.7 & 0.7 \\ 0.7 & 0.7 & 1.0 & 0.6 \\ 0.7 & 0.7 & 0.6 & 1.0 \end{bmatrix}, \]

求:

(1)樣本典型相關變量。有一個樣本的標准化數值為\((0.1, 0.3, -0.2, 0.4)\),求其第一對典型相關得分。

(2)設\(X\)的典型相關變量為\(V=(V_1,V_2)'=A'X\)\(Y\)的典型相關變量為\(W=(W_1,W_2)=B'Y\),求\(V_1\)解釋\(X\)的總變差百分比、\(W_1\)解釋\(Y\)的總變差百分比,以及第一對典型變量中\(X\)的冗余測度。

解:(1)由上一題取\(\alpha=0.5,\nu=0.6,\beta=0.7\),已知其第一對典型相關變量的權重向量為

\[a_1=\begin{bmatrix} 0.577 \\ 0.577 \end{bmatrix},\quad b_1=\begin{bmatrix} 0.559 \\ 0.559 \end{bmatrix}, \]

容易解得

\[a_2=\begin{bmatrix} 1 \\ -1 \end{bmatrix},\quad b_2=\begin{bmatrix} 1.118 \\ -1.118 \end{bmatrix}. \]

樣本的第一對典型相關得分為\((0.2308,0.1118)\)

(2)這里

\[A=\begin{bmatrix} 0.577 & 1 \\ 0.577 & -1 \end{bmatrix},B=\begin{bmatrix} 0.559 & 1.118 \\ 0.559 & -1.118 \end{bmatrix}. \\R_{11}A=\begin{bmatrix} 0.866 & 0.5 \\ 0.866 & 0.5 \end{bmatrix},R_{22}B=\begin{bmatrix} 0.894 & 0.447 \\ 0.894 & -0.447 \end{bmatrix}. \]

\(V_1\)解釋\(X\)的總變差百分比和\(W_1\)解釋\(Y\)的總變差百分比為

\[R_d(X;V_1)=\frac{1}{2}\sum_{i=1}^2\rho^2(X_i, V_1)=0.750,\\ R_d(Y;W_1)=\frac{1}{2}\sum_{i=1}^2\rho^2(Y_i, W_1)=0.799. \]

第一對典型變量中\(X\)的冗余測度為

\[R_{12}B=\begin{bmatrix} 0.7826 & 0 \\ 0.7826 & 0 \end{bmatrix} \\R_d(X;W_1)=\frac{1}{2}\sum_{i=1}^2\rho^2(X_i,W_1)=0.6125. \]


免責聲明!

本站轉載的文章為個人學習借鑒使用,本站對版權不負任何法律責任。如果侵犯了您的隱私權益,請聯系本站郵箱yoyou2525@163.com刪除。



 
粵ICP備18138465號   © 2018-2025 CODEPRJ.COM