實驗目的
(1)熟悉統計的基本概念、參數估計、假設檢驗。
(2.)會用參數估計和假設檢驗對實際問題進行分析。
實驗要求
實驗步驟要有模型建立,模型求解、結果分析。
實驗內容
(1)某校60名學生的一次考試成績如下:
93 75 83 93 91 85 84 82 77 76 77 95 94 89 91 88 86 83 96 81 79 97 78 75 67 69 68 84 83 81 75 66 85 70 94 84 83 82 80 78 74 73 76 70 86 76 90 89 71 66 86 73 80 94 79 78 77 63 53 55
1)計算均值、標准差、極差、偏度、峰度,畫出直方圖;
2)檢驗分布的正態性;
3)若檢驗符合正態分布,估計正態分布的參數並檢驗參數.
(2)據說某地汽油的價格是每加侖115美分,為了驗證這種說法,一位學者開車隨機選擇了一些加油站,得到某年一月和二月的數據如下:
一月:119 117 115 116 112 121 115 122 116 118 109 112 119 112 117 113 114 109 109 118
二月:118 119 115 122 118 121 120 122 128 116 120 123 121 119 117 119 128 126 118 125
1)分別用兩個月的數據驗證這種說法的可靠性;
2)分別給出1月和2月汽油價格的置信區間;
3)給出1月和2月汽油價格差的置信區間.
實驗步驟
1、解:主要使用MATLAB與SPSS求解,具體求解步驟如下,
(1)編寫MATLAB程序求解,代碼如下

1 %數據 2 x=[93,75,83,93,91,85,84,82,77,76,77,95,94,89,91,88,86,83,96,81,79,97,78,75,67,69,68,84,83,81,75,66,85,70,94,84,83,82,80,78,74,73,76,70,86,76,90,89,71,66,86,73,80,94,79,78,77,63,53,55]; 3 %總樣本數 4 n=length(x); 5 %平均值 6 x_bar=sum(x)*1/n 7 %標准差 8 temp1=0; 9 for i=1:n 10 c=x(i)-x_bar; 11 temp1=temp1+c^2; 12 end 13 s=sqrt(temp1*(1/(n-1))) 14 %極差 15 x_max=max(x); 16 x_min=min(x); 17 x_jicha=x_max-x_min 18 %偏度 19 temp2=0; 20 for i=1:n 21 c=x(i)-x_bar; 22 temp2=temp2+c^3; 23 end 24 g1=(1/s)^3*temp2 25 %峰度 26 temp3=0; 27 for i=1:n 28 c=x(i)-x_bar; 29 temp3=temp3+c^4; 30 end 31 g2=(1/s)^4*temp3 32 %畫出直方圖 33 bar(x)
運行結果,
平均值 |
標准差 |
極差 |
偏度 |
峰度 |
80.10 |
9.71 |
44.00 |
-27.39 |
1.83 |
見圖
(2)SPSS求解步驟:
首先,做出正態曲線直方圖:
由上圖可見,該校這60名學生的的成績分布與正態分布相近。本報告對其做正態檢驗。
畫出Q-Q圖和P-P圖
由上所做圖像可知,數據序列稍有偏差地集中在直線上,並由去趨勢的正態P-P
由圖可見,數據點的偏差均小於0.04,可以認為該60名學生的成績符合正態分布。下面對此做進一步檢驗。使用K-S檢驗
單樣本柯爾莫戈洛夫-斯米諾夫檢驗 |
||
|
成績 |
|
個案數 |
60 |
|
正態參數a,b |
平均值 |
80.10 |
標准 偏差 |
9.711 |
|
最極端差值 |
絕對 |
.066 |
正 |
.041 |
|
負 |
-.066 |
|
檢驗統計 |
.066 |
|
漸近顯著性(雙尾) |
.200c,d |
|
a. 檢驗分布為正態分布。 |
||
b. 根據數據計算。 |
||
c. 里利氏顯著性修正。 |
||
d. 這是真顯著性的下限。 |
綜上所述,該校60名學生的成績符合正態分布。
(3)由(2)可知,該60名學生的成績符合正態分布。對正態分布的均值和方差的最大似然估計分別為,
使用MATLAB求解,代碼如下

1 %估計均值 2 niu=x_bar 3 %估計方差 4 temp4=0; 5 d=1/n; 6 for i=1:n 7 c=x(i)^2; 8 temp4=temp4+c; 9 end 10 sigama=d*temp4-(d*sum(x))^2
使用SPSS對估計值進行檢驗,首先對均值進行t檢驗。
單樣本統計 |
||||
|
個案數 |
平均值 |
標准 偏差 |
標准 誤差平均值 |
成績 |
60 |
80.10 |
9.711 |
1.254 |
單樣本檢驗 |
||||||
|
檢驗值 = 80.1 |
|||||
t |
自由度 |
Sig.(雙尾) |
平均值差值 |
差值 95% 置信區間 |
||
下限 |
上限 |
|||||
成績 |
.000 |
59 |
1.000 |
.000 |
-2.51 |
2.51 |
2、解:主要使用MATLAB求解,
(1) 首先使用一月份的數據檢驗該說法,對該組數據進行t檢驗,零假設為可靠,非零假設為不可靠,代碼如下

1 %一月份的 2 x1=[119,117,115,116,112,121,115,122,116,118,109,112,119,112,117,113,114,109,109,118]; 3 [h,sig,ci]=ttest(x1,115)
一月份t檢驗的結論
h |
sig |
ci |
0 |
0.8642 |
113.34~116.96 |

1 %二月份的 2 x2=[118,119,115,122,118,121,120,122,128,116,120,123,121,119,117,119,128,126,118,125]; 3 [h,sig,ci]=ttest(x2,115)
二月份t的檢驗的結論,
h |
sig |
ci |
1 |
1.32e-6 |
119.01~122.49 |
由上述的計算結果,得到如下結論,在一月份該說法是合理的,在二月份該說法是不合理的。
(1) 分別給出1月和2月汽油價格的置信區間α=0.05;
一月份汽油價格的置信區間,使用MATLAB求解:

1 %一月份的 2 x1=[119,117,115,116,112,121,115,122,116,118,109,112,119,112,117,113,114,109,109,118]; 3 [mu1,sigmal,mucil,sigmacil]=normfit(x1,0.05)
計算結果主要展示置信區間,(113.3388,116.9612)。
二月份汽油價格的置信區間,使用MATLAB求解:

1 %二月份的 2 x2=[118,119,115,122,118,121,120,122,128,116,120,123,121,119,117,119,128,126,118,125]; 3 [mu2,sigma2,muci2,sigmaci2]=normfit(x2,0.05)
計算結果主要展示置信區間,(119.0129,122.4871)。
(1) 給出1月和2月汽油價格差的置信區間,使用MATLAB求解:

1 x1=[119,117,115,116,112,121,115,122,116,118,109,112,119,112,117,113,114,109,109,118]; 2 x2=[118,119,115,122,118,121,120,122,128,116,120,123,121,119,117,119,128,126,118,125]; 3 [h1,sig1,ci1]=normfit(x2-x1,0.05) 4 [h2,sig2,ci2]=ttest(x2,x1,0.05,0)
計算結果:
月份 |
h |
sig |
ci |
1 |
5.6000 |
5.4715 |
3.0393~8.1607 |
2 |
1.0000 |
2.0582e-04 |
3.0393~8.1607 |
結果如上表所示。
小結
在做統計分析的過程中,SPSS的體驗最友好,但是使用SPSS並不能很好地體會到每一步的計算算結果的由來,在學習統計學的初期建議使用MATLAB或者SPSS編程求解統計學問題。