1.如何刪除某幾行的數據
drop if year2==2014 | year2==2013
2.如何計算連續幾年的標准差
*year2為int型
bys stkcd (year2):gen roa1=adjroa[_n-1] bys stkcd (year2):gen roa2=adjroa[_n-2] bys stkcd (year2):gen roa3=adjroa[_n+1] bys stkcd (year2):gen roa4=adjroa[_n+2] egen roasd=rowsd(roa1 roa2 adjroa roa3 roa4)
3.如何實現excel與stata的數據導入導出?
復制粘貼就行啦~
4.如何打開csv格式文件?
insheet using "路徑+文件名",clear
5.如何實現分組並求平均值?
*bysort year group按照年份和行業來分組計算,mean為求平均值,meanroa為新的變量名,egen為生成一列新的變量
bysort year group:
egen meanroa=mean(roa)
6.如何對數據進行分組編號?
egen new_id = group(industry)
7.變量重新命名
ren f050201b ROA
8.縮尾處理
*winsor命令是用第1%的數據去替換前1%的數據,用第99%的數據去替換后1%的數據
. winsor roa, gen(newroa) p(0.01)
. winsor2 roa, cuts(1 99) by(group)
*winsor2相比於winsor命令的改進:
(1) 可以批量處理多個變量;
(2) 不僅可以 winsor,也可以 trimming;
(3) 附加了 by() 選項,可以分組 winsor 或 trimming;
(4) 增加了 replace 選項,可以不必生成新變量,直接替換原變量。
范例:
*- winsor at (p1 p99), get new variable "wage_w"
. sysuse nlsw88, clear
. winsor2 wage
*- left-trimming at 2th percentile
. winsor2 wage, cuts(2 100) trim
*- winsor variables by (industry south), overwrite the old variables
. winsor2 wage hours, replace by(industry south)
9.安裝某個命令
. findit winsor2
10.分組比較兩個正態總體樣本的均值
. ttest roasd, by (vc) unequal
尤其注意by后面那個括號啊....被坑死(哭
11.分組比較兩個樣本的方差
. sdtest roasd, by (vc)
12.取某一行中的最大值最小值
egen roasd_max=rmax(roasd1 roasd2 roasd roasd3 roasd4)
13.Wilcoxon秩和檢驗
ranksum 觀察值變量,by(分組變量)