本文链接:https://www.cnblogs.com/snoopy1866/p/15092050.html
SAS中的proc sort过程可以对数据集进行排序,除此之外,proc sort过程还可以具有删除数据集中重复观测的作用。
首先准备数据集,现有三个受试者A,B,C,分别在不同日期服用了不同的药物,一个受试者一天只能服用一种药物,其中数据集第5,6行为重复数据
data data1; input name $ date yymmdd10. drug $; format date yymmdd10.; cards; A 2020-10-01 氨甲环酸 B 2020-11-04 弗雷他定 C 2020-09-28 依巴斯汀 A 2020-10-02 弗雷他定 B 2020-11-04 弗雷他定 /*重复数据*/ A 2020-10-01 氨甲环酸 /*重复数据*/ C 2020-10-01 氨甲环酸 B 2020-11-03 氨甲环酸 ; run;
使用proc sort过程的 nodupkey 选项删除重复数据:
proc sort data = data1 nodupkey out = data2; by name date; run;
输出结果: