一、為什么要做祖先成分的PCA? GWAS研究時經常碰到群體分層的現象,即該群體的祖先來源多樣性,我們知道的,不同群體SNP頻率不一樣,導致后面做關聯分析的時候可能出現假陽性位點(不一定是顯著信號位點與該表型有關,可能是與群體SNP頻率差異有關),因此我們需要在關聯分析前對該群體做PCA分析 ...
在全基因組關聯分析中,處理芯片數據時,必須走的一個流程就是基因型數據填充 imputation 。 當然,如果你拿到的是全測序的數據,請忽略這一步。 下面直奔主題,怎么在網頁版進行基因型填充。 進入Michigan Imputation Server Michigan Imputation Server網站鏈接:https: imputationserver.sph.umich.edu index ...
2019-05-08 10:15 0 1003 推薦指數:
一、為什么要做祖先成分的PCA? GWAS研究時經常碰到群體分層的現象,即該群體的祖先來源多樣性,我們知道的,不同群體SNP頻率不一樣,導致后面做關聯分析的時候可能出現假陽性位點(不一定是顯著信號位點與該表型有關,可能是與群體SNP頻率差異有關),因此我們需要在關聯分析前對該群體做PCA分析 ...
歸納總結:伴X遺傳,雄性中Xb的基因頻率等於基因型頻率,在雌性中,Xb基因頻率也等於雄性中Xb基因的頻率。因為雌性有兩條X染色體,其遺傳符合遺傳平衡定律,即:(P+Q)²=P²+2PQ+Q²=1,P代表代表XB ‚Q代表Xb,P²代表XBXB,2PQ代表XBXb,Q代表XbXb。 ...
首先,下載SHAPEIT. 按照里面的步驟安裝完后,將vcf文件進行基因型定相,分四步走。 第一步,將vcf文件轉化為plink二進制文件(.bed, .bim, .fam)。 這一步需要用到GATK里的GenomeAnalysisTK工具,見如下命令: java -Xmx8g ...
如果想將基因型轉化為0,1,2 可以使用命令:plink --bfile file --recodeA --out recodefile 如果想將基因型轉化為0,1 可以使用命令:plink --bfile file --recodeD --out recodefile 如果想將基因型同時轉化 ...
基因型過濾標准:保留雙等位基因(biallelic sites)以及次等位基因頻率大於0.05的位點: bcftools view --types snps -m 2 -M 2 -q 0.05:minor genotypes.chr22.vcf | bgzip -c > ...
一、芯片數據 此次拿到的illumina芯片數據並不是原始的數據,已經經過GenomeStudio軟件處理成了finalreport文件,格式如下: 之前沒處理過芯片數據,對於這種編碼模式(Forward,top AB)的基因型數據很疑惑,查了很多資料,收效甚微。看過建明大神對芯片這塊 ...
在合並數據過程當中,經常會發現不同來源的數據正負鏈不是統一的,這是一件很頭疼的事。 正負鏈沒有統一的情況下直接合並在一起會產生什么后果呢。 舉個最簡單的例子,假如我們從小明和小紅分別拿到了一批基因型數據。那么存在以下幾種可能:1)小明的基因型數據統一好正鏈或者負鏈;2)小紅的基因型數據統一 ...
GWAS學習筆記——imputation的含義 (Truth of Imputation) Do not imput onther's sin to yourself scheme of imputation in statistics GWAS學習筆記 ...