相關分析sas


相關分析是對進一步分析的很多幫助的一種分析方法,通過簡單的散點圖可以直觀的看出兩個變量之間的關系

1:corr procedure解決兩個連續變量間的關系

2:列聯表分析一般研究離散變量或定性變量間是否存在相關關系,通過proc freq實現

2.1:兩個定性變量(其中一個無序)之間有無關系可以通過卡方分布檢驗

2.2:兩個定性變量之間有無因果關系可以通過趨勢檢驗

/***********************************************proc corr****************************************************************/

PROC CORR <options> ;

BY variables ;

FREQ variable ;

ID variables ;

PARTIAL variables ;

VAR variables ;

WEIGHT variable ;

WITH variables ; 

 

proc corr data=renmin.fitness pearson spearman nosimple; *利用不同相關系數做的相關性分析 nosimple,去除不必要的統計量; var weight Oxygen runtime; *得出的結果所有可能結合的相關性度量以及是否有相關性的假設檢驗;
with var1-var10;*計算var中的每個變量分別與var1-var10的每個變量間的關系,即組與組之間的關系;
run;

 

*偏相關分:析假設我們需要計算X和Y之間的相關性,Z代表其他所有的變量,X和Y的偏相關系數可以認為是X和Z線性回歸得到的殘差Rx與Y和Z線性回歸得到的殘差Ry之間的簡單相關系數,即pearson相關系數;
proc
corr data=corr_eg; var height weight; partial age; *移除partial的影響后,看height 和 weight的關系強度; run;

 

 

/***********************************************proc freq****************************************************************/

proc freq的研究兩個離散變量間的相關性功能

PROC FREQ <options> ;

TABLES requests </ options> ;

TEST options ;

WEIGHT variable </ option> ;  *當我們不希望輸入很多觀測行時,可用weight作為權重進行計算,freq規定weight的列,在列聯表中相應的顯示出來;

 

weight的例子
data test; input
group$ outcome$ count; datalines; drug alive 90 drug dead 10 placebo alive 80 placebo dead 20 ; run; proc freq data=test; table group*outcome / chisq norow nocol nopercent; weight count;*如果沒有weight,那么列聯表中就全為1了; run;

 

proc format;
   value purfmt 1 = "$100 +"
                0 = "< $100"
                  ;
run;
*無序的定性雙變量分析; proc freq data=double.b_sales_inc;
   tables gender*purchase
          / chisq expected cellchi2 nocol nopercent; *chisq是關鍵,看卡方統計量;
   format purchase purfmt.;
   title1  'Association between GENDER and PURCHASE';
run;

 

data double.b_sales_inc;
   set double.b_sales;
   inclevel = 1*(income='Low') + 2*(income='Medium')
                + 3*(income='High');
run;

proc format;
   value purfmt 1 = "$100 +"
                0 = "< $100"
                  ;
run;
proc format;
   value incfmt 1='Low Income'
                2='Medium Income'
                3='High Income';
run;
*有序的定性雙變量分析; proc freq data=double.b_sales_inc;
  tables inclevel*purchase / chisq trend measures cl;*看mantel-haenszel卡方,再看趨勢檢驗;
  format inclevel incfmt. purchase purfmt.;
  title1 'Ordinal Association between INCLEVEL and PURCHASE?';
 run;

 


免責聲明!

本站轉載的文章為個人學習借鑒使用,本站對版權不負任何法律責任。如果侵犯了您的隱私權益,請聯系本站郵箱yoyou2525@163.com刪除。



 
粵ICP備18138465號   © 2018-2025 CODEPRJ.COM