【翻譯】GWAS教程:質量控制和統計分析【第四部分:附錄-名詞解釋】


原文標題:A tutorial on conducting genome-wide association studies: Quality control and statistical analysis
原文鏈接:https://pubmed.ncbi.nlm.nih.gov/29484742/

附 | 名詞解釋

聚集(Clumping):一個過程,其中僅識別和選擇每個LD塊中最重要的SNP(即最低p值)以進行進一步的分析。這降低了剩余SNP之間的相關性,同時保留了具有最強統計證據的SNP。

共同遺傳性(Co-heritability):衡量疾病之間遺傳關系的指標。基於SNP的遺傳性是由SNP解釋的疾病對(例如精神分裂症和雙向情感障礙)之間的協方差比例。

基因(Gene):DNA中編碼分子(例如蛋白質)的核苷酸序列。

雜合性(Heterozygosity):指兩個不同等位基因對特定SNP的攜帶。個體的雜合率是雜合基因型的比例。個體內高水平的雜合性可能表明樣本質量低,而低水平的雜合性可能是由於近親繁殖。

個體層面的缺失(Individual-level missingness):指特定個體缺失SNP的數量。大量的缺失可以認為揭示了DNA樣本質量較差或者技術上的問題。

連鎖不平衡(Linkage disequilibrium, LD):對給定群體中同一染色體中不同位點等位基因之間非隨機關聯的衡量。當SNP等位基因的關聯概率高於隨機分類下的預期時,SNP處於連鎖不平衡狀態。LD關注SNP之間的相關性模式。

次要等位基因頻率(Minor allele frequency, MAF):在特定位置上最不常出現的等位基因的頻率。大多數研究不足以檢測與低MAF的SNP的關聯,因此這些SNP需要被排除。

種群分層(Population stratification):指的是研究中出現多個亞群的情況(例如,具有不同種族背景的個體)。由於等位基因頻率在不同的亞群之間可能是不同的,因此種群分層可能導致假陽性關聯以及/或者掩蓋真實關聯。一個很好的例子是筷子基因(chopstick gene),由於種群分層,單個SNP占筷子進食能力差異的近一半(Hamer和Sirota,2000年)。

修剪(Pruning):一種選擇處於近似連鎖平衡的標記子集的方法。在PLINK中,該方法使用染色體特定窗口(區域)內SNP之間的LD強度,並根據用戶指定的LD閾值僅選擇近似不相關的SNP。與Clumping相反,Pruning不考慮SNP的p值。

相關性(Relatedness):表明一對個體在遺傳上的相關性強度。傳統的GWAS假設所有受試者都是不相關的(即沒有任何一對個體比二級親屬(second-degree relatives)更密切相關)。如果沒有經過適當的校正,包括親屬可能會導致對SNP效應大小的標准誤差的估計有偏差。請注意,已經開發了用於分析家庭數據的特定工具。

性別差異(Sex discrepancy):制定性別與基於基因型確定的性別之間的差異。這個差異可能表明了實驗室中的樣品存在混淆。請注意,只有在評估了性染色體(X和Y)上的SNP后才能進行此測試。

單核苷酸多態性(Single nucleotide polymorphism, SNP):發生在基因組特定位置的單個核苷酸(即A、C、G或T)的變異。SNP通常以兩種不同的形式存在(例如,A與T)。這些不同的形式被稱為等位基因。具有兩個等位基因的SNP具有三種不同的基因型(例如AA、AT和TT)。

SNP遺傳力(SNP-heritability):分析中所有SNP解釋的性狀表型變異的分數。

SNP層面的缺失(SNP-level missingness):樣本中特定SNP信息缺失的個體數量。高度缺失SNP情況的存在可能會導致偏差。

匯總統計(Summary statistics):進行GWAS之后獲得的結果,包括有關染色體數量、SNP位置、SNP(rs)-標識符、MAF、效應大小(odds ratio/beta)、標准差和p值等信息。GWAS的匯總統計數據通常可以免費獲取或在研究者之間共享。

哈代-溫伯格平衡\不平衡(HWE)定律:這涉及到等位基因和基因型頻率之間的關系。它假設一個無限大的種群,沒有選擇、突變或遷移。定律規定基因型和等位基因頻率在幾代人中是恆定的。違反HWE定律表明基因型頻率與預期顯著不同(例如,如果等位基因A的頻率=0.20、等位基因T的頻率=0.80;基因型AT的預期頻率為2*0.2*0.8=0.32)和觀察到的頻率不應有顯著差異。在GWAS中,通常假設與HWE的偏差是基因型分型錯誤的結果。cases中的HWE閾值通常不如controls中的嚴格,因為在cases中違背HWE定律可能表明與疾病風險的真正遺傳關聯。

補充

2021.7.6

后面還有一章講PRS的,暫時就不翻譯了,如果什么時候用上PRS才會翻吧;接下來可能會翻一些GWAS相關軟件工具包的實現原理論文


免責聲明!

本站轉載的文章為個人學習借鑒使用,本站對版權不負任何法律責任。如果侵犯了您的隱私權益,請聯系本站郵箱yoyou2525@163.com刪除。



 
粵ICP備18138465號   © 2018-2025 CODEPRJ.COM