原文:利用SHAPEIT將vcf文件進行基因型(genotype)定相(phasing):查看兩個突變是否來源於同一條鏈(染色體或父本或母本),two mutations carried by the same read

首先,下載SHAPEIT. 按照里面的步驟安裝完后,將vcf文件進行基因型定相,分四步走。 第一步,將vcf文件轉化為plink二進制文件 .bed, .bim, .fam 。 這一步需要用到GATK里的GenomeAnalysisTK工具,見如下命令: java Xmx g jar GenomeAnalysisTK.jar T VariantsToBinaryPed R GRCh .fa V f ...

2018-06-20 16:38 0 1915 推薦指數:

查看詳情

基因染色體定位

1.基因染色體定位TBtools Graphics-show gene on chr-第一個 文件准備: ①染色體長度信息 ②基因位置信息 #①:染色體長度文件基因組序列提取每條染色體的長度信息,結果是NC_開頭的基因組編號,不是染色體號 記錄 ...

Fri Dec 10 18:58:00 CST 2021 0 4019
細胞,染色體,DNA與基因的關系

資料來源: 細胞、染色體、DNA和基因的關系 細胞核中包含染色體,人體共有23對染色體(22+XY/XX),染色體由DNA組成,DNA是由互補鹼基對組成的雙螺旋結構,DNA中只有一部分信息可以編碼為蛋白質,這些蛋白質是構成細胞和組織最小的組成成分,這些有效編碼的部分稱為gene,而不能有效編碼 ...

Wed Jun 24 23:40:00 CST 2020 0 2646
GWAS: 網頁版的基因型填充(genotype imputation)

在全基因組關聯分析中,處理芯片數據時,必須走的一個流程就是基因型數據填充(imputation)。 當然,如果你拿到的是全測序的數據,請忽略這一步。 下面直奔主題,怎么在網頁版進行基因型填充。 1 進入Michigan Imputation Server Michigan ...

Wed May 08 18:15:00 CST 2019 0 1003
對性染色體進行關聯分析

歡迎來到"bio生物信息"的世界 1 前言 早期的研究普遍只做常染色體的全基因組關聯分析,很少做性染色體的。 主要原因是性染色體的遺傳模式比較復雜,存在X染色體失活,而且男女效應值不大一樣。 其次,也不是所有的表型都是男女有差異的。 再然后,也沒有很好的工具計算性染色體的關聯分析 ...

Tue Nov 19 04:26:00 CST 2019 0 297
利用vcftools比較兩個vcf文件

因為最近有一項工作是比較填充准確性的,中間有用到vcftools比較兩個vcf文件。 使用命令也很簡單: 運行結束會生成一個名為Diff.site.diff.sites_in_files的文件: pso1,ref1和alt1代表file1.snp.vcf文件中位點信息 ...

Thu Dec 12 04:27:00 CST 2019 0 342
GWAS群體分層 (Population stratification):利用plink對基因型進行PCA

一、為什么要做祖先成分的PCA? GWAS研究時經常碰到群體分層的現象,即該群體的祖先來源多樣性,我們知道的,不同群體SNP頻率不一樣,導致后面做關聯分析的時候可能出現假陽性位點(不一定是顯著信號位點與該表型有關,可能是與群體SNP頻率差異有關),因此我們需要在關聯分析前對該群體做PCA分析 ...

Thu Mar 07 01:07:00 CST 2019 0 2575
 
粵ICP備18138465號   © 2018-2025 CODEPRJ.COM