stata數據分組


1. 五分位(中位數)

by year,sort:egen distance_ew_median=median(Ln_geodistance_ew)
gen distance_ew_high=(Ln_geodistance_ew>distance_ew) if Ln_geodistance_ew!=.      //是否加median

2. 分組的方法,分成三組,四組

ssc install astile
astile newvar=exp [if] [in] [, nquantils(#) qc(string) by(varlist)]

其中,nquantils(#)表示將變量取值由小到大分為#個組,如nq(2)表示按中位數進行二等分。

例如:

bysort year: astile quart_SA = SAindex, nq(3)    //xtile quart_SA = SAindex, nq(3)
replace quart_SA=0 if quart_SA==3|quart_SA==2 

3. 按照百分位

pctile 表示從小到大排列

bysort year: egen DACC50=pctile(DACC), p(50)    
gen DACC_group=1 if DACC>=DACC50      //0是下五分位,1是上五分位
replace DACC_group=0 if DACC<DACC50 

 4. 分組計算均值中位數

by year,sort:egen distance_ew_median=median(Ln_geodistance_ew)
gen distance_ew_high=(Ln_geodistance_ew>distance_ew) if Ln_geodistance_ew!=.      //是否加median

組內除該變量之外的變量均值

bys industry2: egen total=total(q)
bys industry2: gen N=_N
gen average=(total-q)/(N-1)

 


免責聲明!

本站轉載的文章為個人學習借鑒使用,本站對版權不負任何法律責任。如果侵犯了您的隱私權益,請聯系本站郵箱yoyou2525@163.com刪除。



 
粵ICP備18138465號   © 2018-2025 CODEPRJ.COM