在全基因組關聯分析中,處理芯片數據時,必須走的一個流程就是基因型數據填充(imputation)。
當然,如果你拿到的是全測序的數據,請忽略這一步。
下面直奔主題,怎么在網頁版進行基因型填充。
1 進入Michigan Imputation Server
Michigan Imputation Server網站鏈接:https://imputationserver.sph.umich.edu/index.html#!pages/home
進入該網站,進行注冊。
注冊完以后,接下來准備imputation需要的輸入文件
2 准備imputation需要的輸入文件
Michigan Imputation Server網站只接受壓縮包的vcf格式(vcf.gz),故需要先將手頭上的文件轉化為vcf.gz格式
2.1 轉化ped/map為vcf格式文件
plink --ped mystudy_chr1.ped --map mystudy_chr1.map --recode vcf --out mystudy_chr1
2.2 將vcf格式文件壓縮為vcf.gz格式
安裝成功后,使用如下命令:
vcf-sort mystudy_chr1.vcf | bgzip -c > mystudy_chr1.vcf.gz
3 上傳數據
以下兩種方式任選一種。
3.1 上傳vcf.gz文件的方式
具體使用操作見下圖: