一般Excel就能實現根據相同的列或ID合並不同的文件,但對於大文件來說,比如幾十個G的數據量,用Excel處理,不僅耗時,而且還會使電腦崩潰。R語言的優勢就體現在這里了,處理大文件相當快。
first<-read.table('/pheno/first.txt',header=T)
first<-data.frame(first)
rs123456761<-read.table("/SNP/rs123456761.ped",header=T)
rs123456761<-data.frame(rs123456761)
merge_rs123456761<-merge(rs123456761,first,by.x='ID',by.y='ID')#假設根據相同的ID合並rs123456761和first兩個文件
write.table(merge_rs123456761,'/SNP/merge_rs123456761.csv', quote = F,sep=" ")
注意:使用merge函數合並文件時,要把文件轉化為數據框格式(data.frame)
