hardy-weinberg平衡:標准定義————
如果一個種群符合下列條件:1.種群是極大的;2.種群個體間的交配是隨機的,也就是說種群中每一個個體與種群中其他個體的交配機會是相等的;3.沒有突變產生;4.種群之間不存在個體的遷移或基因交流;5.沒有自然選擇,那么,這個種群的基因頻率(包括基因型頻率)就可以一代代穩定不變,保持平衡。這就是遺傳平衡定律,也稱哈代c溫伯格平衡。
實際應用中——
做多態性等遺傳分析首先要對數據結果進行hardy-weinberg平衡分析,當然——如果是病例對照研究的話,病例組由於該遺傳多態可能與疾病有關聯的話,很可能不符合hardy-weinberg平衡,此時也是正常現象,但是對照組無論如何都要符合這個平衡的。
哈代-溫伯格平衡定律(Hardy-Weinberg equilibrium),即HW平衡,是指對於一個大且隨機交配的種群,基因頻率和基因型頻率在沒有遷移、突變和選擇的條件下會保持不變。
它是建立在一個理想的群體模式上的,有四個假設前提:1.群體無限大;2.隨機婚配;3.沒有突變;4.沒有大規模遷移和選擇因素的影響。其結論是群體中的基因頻率和基因型頻率在逐代傳遞中保持不變。
實際上這種理想群體的條件不可能完全滿足,但經過數學推導,在一個群體中,基因頻率和基因型頻率在每一代都是恆定的,即使未達到平衡的群體,只需繁殖一代即可重新達到平衡。
其一個重要意義在於對抽樣調查的結果進行檢驗,評估所研究的對象群體是否符合HW平衡,從而評估群體調查資料的可靠性,特別是在遺傳流行病學關聯研究中。
通常采用吻合度檢驗運用卡方統計量衡量基因型數目的觀察值與該位點上全部基因型頻率分布在符合HW平衡時的期望值之間的吻合程度。一般以P=0.05作為顯著性水平的界值,P>0.05說明所調查的群體達到遺傳平衡,即本次群體調查的數據可信;反之,P<0.05時,需要考慮以下問題:1.被調查的群體是否處於遺傳平衡狀態;2.遺傳標記(如SNP)分型的技術或標准是否出現誤差;3.是否達到隨機抽樣的要求。特別是后兩點需要注意!
舉個例子,如下:
1,三個基因類型(genotype)實際數(O):
AA---AB---BB
1787 3039 1303 總數 N=6129
2,等位(allele)頻率
F(A) = (1787 + 3039/2) / 6129 = 0.54 = p
F(B ) = (1303 + 3039/2) / 6129 = 0.46 = q … and S(p,q)=1
3,期待genotype頻率:
期待AA 頻率: p2 = (0.54)2 = 0.2916
期待AB頻率: 2pq = 2x 0.54 x 0.46 = 0.4968
期待BB 頻率: q2 = (0.46)2 = 0.2116
4, 期待genotype數 (Q):
期待AA : p2N = 0.2916 x 6129 = 1787.2
期待AB : 2pqN = 0.4968 x 6129 = 3044.9
期待BB : q2N = 0.2116 x 6129 = 1296.9
5, 卡方值
X2 = (OAA-QAA)2[平方]/QAA + (OAB-QAB )2[平方]/QAB + (OBB-QBB )2[平方]/QBB
再根據X2求出P值!!
文獻:遺傳流行病學研究中的H-W平衡檢驗
http://www.docin.com/p-91862556.html
在HWE檢測中常用的是Pearson goodness-of-fit test,也就是我們常說的卡方檢驗因為近似於卡方分布。雖然這種方法容易計算,但是近似度不高特別是基因型數很低的時候,所以目前用Fisher exact test替代。
我給大家介紹一個目前公認source code! 分別用R,C/C++,Fortran寫的!
若用此source code,寫文章時候需引用如下:
A Note on Exact Tests of Hardy-Weinberg Equilibrium.
Wigginton JE, Cutler DJ and Abecasis GR
Am J Hum Genet (2005) 76: 887-93
【求助】請問HEW檢驗的結果是怎么看的。P要大於還是小於多少?謝謝
slisten wrote:
Sample size is one aspect, but not all. You'd better do a power analysis first, which can evaluate whether your samples are enough to reach specific statistical power.
0.05 is a common threshold for HWE p value. 0.01 is also used sometime. If you have multiple markers, remember the multiple test significance level, which is usually more tolerant than single test. For example, HWE p threshold for GWAS is usually 0.001 or 0.0001