MEANS過程
- MEAN過程默認輸出的統計量有:觀測總數、均值、標准差、最大值和最小值。如果要計算其他統計量或其中的某一些統計量,則可在PROC語句中指定統計量的關鍵字。
- BY語句規定了分組變量,要求在BY分組內計算描述性統計量 。
proc means data=data.bank min p1 q1 mean median q3 p99 max ; run;
UNIVARIATE過程
- UNIVARIATE過程也可以提供描述統計量的計算,另外還有統計頻數、繪制圖形和假設檢驗的功能。
- 使用UNIVARIATE過程計算描述統計量與MEANS過程所用的語句和選項都基本類似,只是UNIVARIATE過程不需要指定統計量關鍵字,而是默認給出所有的基本統計量和一些關於位置檢驗的結果。
proc univariate data=data.bank; run;
FREQ過程
- 描述分析,產生頻數表和列聯表,可以簡單的描述數據
- 統計推斷產生各種統計量,分析變量之間的關系
- TableS 用來定義頻數表或交叉表,可以有多個tables語句。當頻數表是命令為tables JOB1, 生成一維表;而命令為: tables JOB1*good_bad;變量之間中間用*隔開,表示生成二維交叉表
- Tables后的選項為norow nocol nopercent:若只需要頻數,不需要各行各列的百分比,可在tables后面加上這些參數
proc freq data=data.bank; table poutcome*y/norow nocol nopercent; run;
- 對連續數值變量做Freq時,系統會對每個數值進行頻數統計,這個結果一般不是我們所需要的。我們一般會將連續變量轉換為離散變量,這個可以通過Format過程步來實現。
proc format; value age_cd 17-<25='<25' 25-<30='25-30' 30-<45='30-45' 45-<60='45-60' 60-high='>=60'; run; proc freq data=data.bank; table y*age/norow nocol nopercent; format age age_cd.; run;