1、SAS過程步的一般形式為:
PROC 過程名稱 DATA=數據庫名稱.數據集名稱 基本選項;
過程語句1 選項;
過程語句2 選項;
RUN;
2、過程步常用語句
在過程步的語句格式中含有"過程語句/選項",下面介紹幾個常見的過程語句。
(1) VAR 語句
用來指定變量名稱,其語句格式為:
VAR 變量名稱1 變量名稱2 ... 變量名稱k;
例如
VAR x1 x2 ... x8;
(2) BY 語句和 CLASS 語句
BY 語句在過程中一般用來指定一個或幾個分類變量,
根據這些分類變量值把觀測分組,然后對每一組觀測分別進行本過程指定的分析,其語句格式為:
BY 變量名稱1 變量名稱2 ... 變量名稱k;
在一些過程(如方差分析)中,使用CLASS語句指定一個或幾個分類變量;
而在另一些過程(如MEANS)中,
CLASSS語句的作用與BY語句類似,可以指定分類變量,把觀測按分類變量后分別進行分析。
使用CLASS語句時不需要先按分類變量排序。
(3) OUTPUT 語句
在過程步中經常用 OUTPUT 語句指定輸出結果存放的數據集。
不同過程中把輸出結果存入數據集的方法各有不同,OUTPUT 語句是用得最多的一種,
其一般格式為:
OUTPUT OUT = 輸出數據集名稱 命令關鍵詞1=變量名1 命令關鍵詞2=變量名2 ...;
其中用 OUT= 給出了要生成的結果數據集的名字,
用 命令關鍵詞1=變量名1 的方式指定了輸出哪些結果
(命令關鍵詞是如MEANS過程中的 MEAN VAR STD 那樣的要輸出的結果名稱,
等號后面的變量名稱指定了這些結果在輸出數據集中叫什么名字。)
(4) WHERE 語句
用 WHERE 語句 可以選擇輸入數據集的一個行子集來進行分析,在 WHERE 后指定了一個條件。
其語句格式為:
WHERE 條件;
例如
where gender=0 and income>=8000;
(5) FORMAT 語句 和 LABEL 語句
過程步中的 FORMAT 語句可以為變量輸出規定一個輸出格式,
比如:
proc print data=c201101;
format score 9.1;
run;
使得列出的score的寬度占9個字符,帶一位小數。
LABEL 語句為變量指定一個臨時標簽,很多過程可以使用這樣的標簽。
LABEL 語句的一般格式為:
LABEL name='姓名' 變量名稱2='標簽2' ... 變量名稱k='標簽k';
3、輸出列表過程語句 PRINT
4、數據排序過程語句 SORT
5、格式化過程語句 FORMAT
6、標題及全程語句 TITLE
form:《SAS軟件與統計應用教程》徐雅靜 機械工業出版社