stata學習筆記(三):計算五年內的ROA標准差所用到的一些知識


1.如何刪除某幾行的數據

drop if year2==2014 | year2==2013

2.如何計算連續幾年的標准差

*year2為int型

bys stkcd (year2):gen roa1=adjroa[_n-1]
bys stkcd (year2):gen roa2=adjroa[_n-2]
bys stkcd (year2):gen roa3=adjroa[_n+1]
bys stkcd (year2):gen roa4=adjroa[_n+2]
egen roasd=rowsd(roa1 roa2 adjroa roa3 roa4)

3.如何實現excel與stata的數據導入導出?

復制粘貼就行啦~

4.如何打開csv格式文件?

insheet using "路徑+文件名",clear

5.如何實現分組並求平均值?

*bysort year group按照年份和行業來分組計算,mean為求平均值,meanroa為新的變量名,egen為生成一列新的變量

bysort year  group:    
egen meanroa=mean(roa)

6.如何對數據進行分組編號?

egen new_id = group(industry)

7.變量重新命名

ren f050201b ROA

 8.縮尾處理

*winsor命令是用第1%的數據去替換前1%的數據,用第99%的數據去替換后1%的數據

. winsor roa, gen(newroa) p(0.01)
. winsor2 roa, cuts(1 99) by(group)

 *winsor2相比於winsor命令的改進:

(1) 可以批量處理多個變量;
(2) 不僅可以 winsor,也可以 trimming
(3) 附加了 by() 選項,可以分組 winsor 或 trimming
(4) 增加了 replace 選項,可以不必生成新變量,直接替換原變量。

范例:
    *- winsor at (p1 p99), get new variable "wage_w"
    .   sysuse nlsw88, clear
    .   winsor2 wage
    *- left-trimming at 2th percentile
    .   winsor2 wage, cuts(2 100) trim
    *- winsor variables by (industry south), overwrite the old variables
    .   winsor2 wage hours, replace by(industry south)

9.安裝某個命令

. findit winsor2

10.分組比較兩個正態總體樣本的均值

. ttest roasd, by (vc) unequal

尤其注意by后面那個括號啊....被坑死(哭

11.分組比較兩個樣本的方差

. sdtest roasd, by (vc)

 12.取某一行中的最大值最小值

egen roasd_max=rmax(roasd1 roasd2 roasd roasd3 roasd4)

 13.Wilcoxon秩和檢驗

ranksum 觀察值變量,by(分組變量)

 


免責聲明!

本站轉載的文章為個人學習借鑒使用,本站對版權不負任何法律責任。如果侵犯了您的隱私權益,請聯系本站郵箱yoyou2525@163.com刪除。



 
粵ICP備18138465號   © 2018-2025 CODEPRJ.COM