SAS描述統計量

本文轉載自查看原文 2017-02-11 22:17 1390

MEANS過程

MEAN過程默認輸出的統計量有：觀測總數、均值、標准差、最大值和最小值。如果要計算其他統計量或其中的某一些統計量，則可在PROC語句中指定統計量的關鍵字。
BY語句規定了分組變量，要求在BY分組內計算描述性統計量。

proc means data=data.bank
   min p1 q1 mean median q3 p99 max ;
run;

UNIVARIATE過程

UNIVARIATE過程也可以提供描述統計量的計算，另外還有統計頻數、繪制圖形和假設檢驗的功能。
使用UNIVARIATE過程計算描述統計量與MEANS過程所用的語句和選項都基本類似，只是UNIVARIATE過程不需要指定統計量關鍵字，而是默認給出所有的基本統計量和一些關於位置檢驗的結果。

proc univariate data=data.bank;
run;

FREQ過程

描述分析，產生頻數表和列聯表，可以簡單的描述數據
統計推斷產生各種統計量，分析變量之間的關系
TableS 用來定義頻數表或交叉表，可以有多個tables語句。當頻數表是命令為tables JOB1，生成一維表；而命令為： tables JOB1*good_bad；變量之間中間用*隔開，表示生成二維交叉表
Tables后的選項為norow nocol nopercent：若只需要頻數，不需要各行各列的百分比，可在tables后面加上這些參數

proc freq data=data.bank;
  table poutcome*y/norow nocol nopercent;
run;

對連續數值變量做Freq時，系統會對每個數值進行頻數統計，這個結果一般不是我們所需要的。我們一般會將連續變量轉換為離散變量，這個可以通過Format過程步來實現。

proc format;
  value age_cd
  17-<25='<25'
  25-<30='25-30'
  30-<45='30-45'
  45-<60='45-60'
  60-high='>=60';
run;
proc  freq data=data.bank;
   table y*age/norow nocol nopercent;
   format age age_cd.;
run;

免責聲明！

本站轉載的文章為個人學習借鑒使用，本站對版權不負任何法律責任。如果侵犯了您的隱私權益，請聯系本站郵箱yoyou2525@163.com刪除。

猜您在找 R語言中描述統計量的多種方法summary、str等二、描述統計(descriptive statistics) pandas（三）匯總和計算描述統計數據基礎學習（1）描述統計 R語言筆記005——計算描述性統計量統計學基礎知識（一）---描述統計（Descriptive Statistics） python數據分析之Pandas：匯總和計算描述統計統計量與估計量描述統計學：中位數、眾數、百分位數、平均數總體統計量的估計方法