前言 關於選用多少個PCA做群體分層校正,各大期刊並沒有一個統一的說法。 故做了如下綜述。 1 隨心所欲型,想選多少就選多少 PCA想選多少就選多少,這個真的不是開玩笑。有文獻出處有真相! 比如下面文獻直接選用10個PCA校正群體分層。 Largest GWAS of PTSD ...
一 為什么要做祖先成分的PCA GWAS研究時經常碰到群體分層的現象,即該群體的祖先來源多樣性,我們知道的,不同群體SNP頻率不一樣,導致后面做關聯分析的時候可能出現假陽性位點 不一定是顯著信號位點與該表型有關,可能是與群體SNP頻率差異有關 ,因此我們需要在關聯分析前對該群體做PCA分析,隨后將PCA結果作為協變量加入關聯分析中。 二 怎么做PCA 首先prune一下 plink bfile f ...
2019-03-06 17:07 0 2575 推薦指數:
前言 關於選用多少個PCA做群體分層校正,各大期刊並沒有一個統一的說法。 故做了如下綜述。 1 隨心所欲型,想選多少就選多少 PCA想選多少就選多少,這個真的不是開玩笑。有文獻出處有真相! 比如下面文獻直接選用10個PCA校正群體分層。 Largest GWAS of PTSD ...
如果想將基因型轉化為0,1,2 可以使用命令:plink --bfile file --recodeA --out recodefile 如果想將基因型轉化為0,1 可以使用命令:plink --bfile file --recodeD --out recodefile 如果想將基因型同時轉化 ...
在全基因組關聯分析中,處理芯片數據時,必須走的一個流程就是基因型數據填充(imputation)。 當然,如果你拿到的是全測序的數據,請忽略這一步。 下面直奔主題,怎么在網頁版進行基因型填充。 1 進入Michigan Imputation Server Michigan ...
該選擇多少個主成分 群體結構(population structure),或者說群體分層(population stratification),是由於個體之間非隨機交配而導致的群體中亞群之間等位基因頻率的系統差異。這種系統差異,是全基因組關聯研究(GWAS)中影響非常大的混淆變量,可以造成非常大 ...
基因型過濾標准:保留雙等位基因(biallelic sites)以及次等位基因頻率大於0.05的位點: bcftools view --types snps -m 2 -M 2 -q 0.05:minor genotypes.chr22.vcf | bgzip -c > ...
當我們進行群體遺傳分析時,得到vcf后,可利用plink進行主成分(PCA)分析; 一、軟件安裝 二、使用流程 第一步:將vcf轉換為plink格式 上述會得到.map, .nosex和.ped結尾的三個文件。 第二步 ...
歸納總結:伴X遺傳,雄性中Xb的基因頻率等於基因型頻率,在雌性中,Xb基因頻率也等於雄性中Xb基因的頻率。因為雌性有兩條X染色體,其遺傳符合遺傳平衡定律,即:(P+Q)²=P²+2PQ+Q²=1,P代表代表XB ‚Q代表Xb,P²代表XBXB,2PQ代表XBXb,Q代表XbXb。 ...
首先,下載SHAPEIT. 按照里面的步驟安裝完后,將vcf文件進行基因型定相,分四步走。 第一步,將vcf文件轉化為plink二進制文件(.bed, .bim, .fam)。 這一步需要用到GATK里的GenomeAnalysisTK工具,見如下命令: java -Xmx8g ...