stata数据分组


1. 五分位(中位数)

by year,sort:egen distance_ew_median=median(Ln_geodistance_ew)
gen distance_ew_high=(Ln_geodistance_ew>distance_ew) if Ln_geodistance_ew!=.      //是否加median

2. 分组的方法,分成三组,四组

ssc install astile
astile newvar=exp [if] [in] [, nquantils(#) qc(string) by(varlist)]

其中,nquantils(#)表示将变量取值由小到大分为#个组,如nq(2)表示按中位数进行二等分。

例如:

bysort year: astile quart_SA = SAindex, nq(3)    //xtile quart_SA = SAindex, nq(3)
replace quart_SA=0 if quart_SA==3|quart_SA==2 

3. 按照百分位

pctile 表示从小到大排列

bysort year: egen DACC50=pctile(DACC), p(50)    
gen DACC_group=1 if DACC>=DACC50      //0是下五分位,1是上五分位
replace DACC_group=0 if DACC<DACC50 

 4. 分组计算均值中位数

by year,sort:egen distance_ew_median=median(Ln_geodistance_ew)
gen distance_ew_high=(Ln_geodistance_ew>distance_ew) if Ln_geodistance_ew!=.      //是否加median

组内除该变量之外的变量均值

bys industry2: egen total=total(q)
bys industry2: gen N=_N
gen average=(total-q)/(N-1)

 


免责声明!

本站转载的文章为个人学习借鉴使用,本站对版权不负任何法律责任。如果侵犯了您的隐私权益,请联系本站邮箱yoyou2525@163.com删除。



 
粤ICP备18138465号  © 2018-2025 CODEPRJ.COM