Matlab數據的統計分析與描述


實驗目的

  (1)熟悉統計的基本概念、參數估計、假設檢驗。

  (2.)會用參數估計和假設檢驗對實際問題進行分析。

實驗要求

  實驗步驟要有模型建立,模型求解、結果分析。

實驗內容

(1)某校60名學生的一次考試成績如下:

93 75 83 93 91 85 84 82 77 76 77 95 94 89 91 88 86 83 96 81 79 97 78 75 67 69 68 84 83 81 75 66 85 70 94 84 83 82 80 78 74 73 76 70 86 76 90 89 71 66 86 73 80 94 79 78 77 63 53 55

1)計算均值、標准差、極差、偏度、峰度,畫出直方圖; 

2)檢驗分布的正態性; 

3)若檢驗符合正態分布,估計正態分布的參數並檢驗參數.

 

(2)據說某地汽油的價格是每加侖115美分,為了驗證這種說法,一位學者開車隨機選擇了一些加油站,得到某年一月和二月的數據如下: 

一月:119 117 115 116 112 121 115 122 116 118 109 112 119 112 117 113 114 109 109 118

二月:118 119 115 122 118 121 120 122 128 116 120 123 121 119 117 119 128 126 118 125

1)分別用兩個月的數據驗證這種說法的可靠性; 

2)分別給出1月和2月汽油價格的置信區間; 

3)給出1月和2月汽油價格差的置信區間.

實驗步驟

1、解:主要使用MATLAB與SPSS求解,具體求解步驟如下,

  (1)編寫MATLAB程序求解,代碼如下

 1 %數據
 2 x=[93,75,83,93,91,85,84,82,77,76,77,95,94,89,91,88,86,83,96,81,79,97,78,75,67,69,68,84,83,81,75,66,85,70,94,84,83,82,80,78,74,73,76,70,86,76,90,89,71,66,86,73,80,94,79,78,77,63,53,55];
 3 %總樣本數
 4 n=length(x);
 5 %平均值
 6 x_bar=sum(x)*1/n
 7 %標准差
 8 temp1=0;
 9 for i=1:n
10     c=x(i)-x_bar;
11     temp1=temp1+c^2;
12 end
13 s=sqrt(temp1*(1/(n-1)))
14 %極差
15 x_max=max(x);
16 x_min=min(x);
17 x_jicha=x_max-x_min
18 %偏度
19 temp2=0;
20 for i=1:n
21     c=x(i)-x_bar;
22     temp2=temp2+c^3;
23 end
24 g1=(1/s)^3*temp2
25 %峰度
26 temp3=0;
27 for i=1:n
28     c=x(i)-x_bar;
29     temp3=temp3+c^4;
30 end
31 g2=(1/s)^4*temp3
32 %畫出直方圖
33 bar(x)
題1_MATLAB

  運行結果,

平均值

標准差

極差

偏度

峰度

80.10

9.71

44.00

-27.39

1.83

  見圖

  (2)SPSS求解步驟:

  首先,做出正態曲線直方圖:

  由上圖可見,該校這60名學生的的成績分布與正態分布相近。本報告對其做正態檢驗。

  畫出Q-Q圖和P-P

 

           

  由上所做圖像可知,數據序列稍有偏差地集中在直線上,並由去趨勢的正態P-P

  由圖可見,數據點的偏差均小於0.04,可以認為該60名學生的成績符合正態分布。下面對此做進一步檢驗。使用K-S檢驗

單樣本柯爾莫戈洛夫-斯米諾夫檢驗

 

成績

個案數

60

正態參數a,b

平均值

80.10

標准 偏差

9.711

最極端差值

絕對

.066

.041

-.066

檢驗統計

.066

漸近顯著性(雙尾)

.200c,d

a. 檢驗分布為正態分布。

b. 根據數據計算。

c. 里利氏顯著性修正。

d. 這是真顯著性的下限。

    由上表可見,P=0.2>0.05,說明該數據序列與正態分布沒有顯著性差異。

  綜上所述,該校60名學生的成績符合正態分布。

(3)由(2)可知,該60名學生的成績符合正態分布。對正態分布的均值和方差的最大似然估計分別為,

  

  使用MATLAB求解,代碼如下

 1 %估計均值
 2 niu=x_bar
 3 %估計方差
 4 temp4=0;
 5 d=1/n;
 6 for i=1:n
 7     c=x(i)^2;
 8     temp4=temp4+c;
 9 end
10 sigama=d*temp4-(d*sum(x))^2
題2_MATLAB

  使用SPSS對估計值進行檢驗,首先對均值進行t檢驗。

單樣本統計

 

個案數

平均值

標准 偏差

標准 誤差平均值

成績

60

80.10

9.711

1.254

 

單樣本檢驗

 

檢驗值 = 80.1

t

自由度

Sig.(雙尾)

平均值差值

差值 95% 置信區間

下限

上限

成績

.000

59

1.000

.000

-2.51

2.51

   

2、解:主要使用MATLAB求解,

(1) 首先使用一月份的數據檢驗該說法,對該組數據進行t檢驗,零假設為可靠,非零假設為不可靠,代碼如下

1 %一月份的
2 x1=[119,117,115,116,112,121,115,122,116,118,109,112,119,112,117,113,114,109,109,118];
3 [h,sig,ci]=ttest(x1,115)
03

  一月份t檢驗的結論

h

sig

ci

0

0.8642

113.34~116.96

 

1 %二月份的
2 x2=[118,119,115,122,118,121,120,122,128,116,120,123,121,119,117,119,128,126,118,125];
3 [h,sig,ci]=ttest(x2,115)
04

  二月份t的檢驗的結論,

 

h

sig

ci

1

1.32e-6

119.01~122.49

  由上述的計算結果,得到如下結論,在一月份該說法是合理的,在二月份該說法是不合理的。

  (1) 分別給出1月和2月汽油價格的置信區間α=0.05;

  一月份汽油價格的置信區間,使用MATLAB求解:

1 %一月份的
2 x1=[119,117,115,116,112,121,115,122,116,118,109,112,119,112,117,113,114,109,109,118];
3 [mu1,sigmal,mucil,sigmacil]=normfit(x1,0.05)
05

  計算結果主要展示置信區間,(113.3388,116.9612)。

  二月份汽油價格的置信區間,使用MATLAB求解:

1 %二月份的
2 x2=[118,119,115,122,118,121,120,122,128,116,120,123,121,119,117,119,128,126,118,125];
3 [mu2,sigma2,muci2,sigmaci2]=normfit(x2,0.05)
06

  計算結果主要展示置信區間,(119.0129,122.4871)。

  (1) 給出1月和2月汽油價格差的置信區間,使用MATLAB求解:

1 x1=[119,117,115,116,112,121,115,122,116,118,109,112,119,112,117,113,114,109,109,118];
2 x2=[118,119,115,122,118,121,120,122,128,116,120,123,121,119,117,119,128,126,118,125];
3 [h1,sig1,ci1]=normfit(x2-x1,0.05)
4 [h2,sig2,ci2]=ttest(x2,x1,0.05,0)
07

  計算結果:

月份

h

sig

ci

1

5.6000

5.4715

3.0393~8.1607

2

1.0000

2.0582e-04

3.0393~8.1607

  結果如上表所示。

小結

    在做統計分析的過程中,SPSS的體驗最友好,但是使用SPSS並不能很好地體會到每一步的計算算結果的由來,在學習統計學的初期建議使用MATLAB或者SPSS編程求解統計學問題。

 


免責聲明!

本站轉載的文章為個人學習借鑒使用,本站對版權不負任何法律責任。如果侵犯了您的隱私權益,請聯系本站郵箱yoyou2525@163.com刪除。



 
粵ICP備18138465號   © 2018-2025 CODEPRJ.COM