最近有需求,對WGS測序獲得SNP信息進行篩減,可問題是測序個體少,call rate,maf,hwe,等條件過濾后,snp數量還是千萬級別,所以后面利用plink工具根據LD信息來濾除大量SNP標記。 工具版本:PLINK v1.90b4.6 64-bit (15 Aug 2017) 一、格式 ...
一 合並文件 plink合並文件需要用到 merge 參數 如果是ped和map格式文件,則用以下命令: plink file data merge data .ped data .map recode out merge 如果是二進制文件和ped,map格式文件,則用以下命令: plink bfile data merge data .ped data .map make bed out mer ...
2019-01-16 11:49 3 1934 推薦指數:
最近有需求,對WGS測序獲得SNP信息進行篩減,可問題是測序個體少,call rate,maf,hwe,等條件過濾后,snp數量還是千萬級別,所以后面利用plink工具根據LD信息來濾除大量SNP標記。 工具版本:PLINK v1.90b4.6 64-bit (15 Aug 2017) 一、格式 ...
上位置為122-124范圍的位點 cat variants.vcf | java -jar Sn ...
plink --bfile file --extract all.snp --r2 --ld-window-kb 1000 --ld-window-r2 0.8 --ld-snp-list all.snp --out all.snp.08.inter all.snp文件如下所示: ...
純合SNP和雜合SNP是SNP calling軟件如GATK或者SAMtools根據測序深度、鹼基質量值、比對質量值和基因型質量值等綜合判斷出來的純合和雜合, 簡單來說,純合SNP可以認為該位點測到的所有reads只是一種鹼基類型,雜合SNP為二種或二種以上的鹼基類型,不排除特殊位置 ...
本文轉載於https://www.jianshu.com/p/e6d5dd774c6e SNP位點過濾 SNP過濾有兩種情況,一種是僅根據位點質量信息(測序深度,回帖質量等)對SNP進行粗過濾。如果使用GATK對重測序結果進行SNP calling,那么可以考慮下面的標准 QD< ...
通用過濾 Vcftools(http://vcftools.sourceforge.net) 對vcf文件進行過濾 第一步:過濾最低質量低於30,次等位基因深度(minor allele count)不少於3 第二步:上述結果文件 ...
SNP命名 【2016-11-24】 奶茶妹妹是誰,京東老板娘,咦?章澤天!沒錯! 國民老公是誰?萬達少東家,王健林兒子,王思聰!恭喜你又答對了! 函數是誰?這不是 ...
做群體變異檢測后,通常會有提取子集的操作,之前沒有發現bcftools有這個功能,都是自己寫腳本操作,數據量一上來,速度真的是讓人無語凝噎。這里記錄下提取子vcf文件的用法,軟件版本:bcftools-1.5 一、根據個體提取子集 根據樣品名提取vcf文件,准備要保留的個體名文件 ...