SAS描述統計量


MEANS過程

  • MEAN過程默認輸出的統計量有:觀測總數、均值、標准差、最大值和最小值。如果要計算其他統計量或其中的某一些統計量,則可在PROC語句中指定統計量的關鍵字。
  • BY語句規定了分組變量,要求在BY分組內計算描述性統計量 。

  

proc means data=data.bank
   min p1 q1 mean median q3 p99 max ;
run;

 UNIVARIATE過程

  • UNIVARIATE過程也可以提供描述統計量的計算,另外還有統計頻數、繪制圖形和假設檢驗的功能。
  • 使用UNIVARIATE過程計算描述統計量與MEANS過程所用的語句和選項都基本類似,只是UNIVARIATE過程不需要指定統計量關鍵字,而是默認給出所有的基本統計量和一些關於位置檢驗的結果。
proc univariate data=data.bank;
run;

 FREQ過程

  • 描述分析,產生頻數表和列聯表,可以簡單的描述數據
  • 統計推斷產生各種統計量,分析變量之間的關系
  • TableS 用來定義頻數表或交叉表,可以有多個tables語句。當頻數表是命令為tables JOB1, 生成一維表;而命令為: tables JOB1*good_bad;變量之間中間用*隔開,表示生成二維交叉表
  • Tables后的選項為norow nocol nopercent:若只需要頻數,不需要各行各列的百分比,可在tables后面加上這些參數
proc freq data=data.bank;
  table poutcome*y/norow nocol nopercent;
run;
  • 對連續數值變量做Freq時,系統會對每個數值進行頻數統計,這個結果一般不是我們所需要的。我們一般會將連續變量轉換為離散變量,這個可以通過Format程步來實現。
proc format;
  value age_cd
  17-<25='<25'
  25-<30='25-30'
  30-<45='30-45'
  45-<60='45-60'
  60-high='>=60';
run;
proc  freq data=data.bank;
   table y*age/norow nocol nopercent;
   format age age_cd.;
run;

 


免責聲明!

本站轉載的文章為個人學習借鑒使用,本站對版權不負任何法律責任。如果侵犯了您的隱私權益,請聯系本站郵箱yoyou2525@163.com刪除。



 
粵ICP備18138465號   © 2018-2025 CODEPRJ.COM