哈代-溫伯格平衡定律(Hardy-Weinberg equilibrium),即HW平衡,是指對於一個大且隨機交配的種群,基因頻率和基因型頻率在沒有遷移、突變和選擇的條件下會保持不變。
它是建立在一個理想的群體模式上的,有四個假設前提:1.群體無限大;2.隨機婚配;3.沒有突變;4.沒有大規模遷移和選擇因素的影響。其結論是群體中的基因頻率和基因型頻率在逐代傳遞中保持不變。
實際上這種理想群體的條件不可能完全滿足,但經過數學推導,在一個群體中,基因頻率和基因型頻率在每一代都是恆定的,即使未達到平衡的群體,只需繁殖一代即可重新達到平衡。
其一個重要意義在於對抽樣調查的結果進行檢驗,評估所研究的對象群體是否符合HW平衡,從而評估群體調查資料的可靠性,特別是在遺傳流行病學關聯研究中。
通常采用吻合度檢驗運用卡方統計量衡量基因型數目的觀察值與該位點上全部基因型頻率分布在符合HW平衡時的期望值之間的吻合程度。一般以P=0.05作為顯著性水平的界值,
P>0.05說明所調查的群體達到遺傳平衡,即本次群體調查的數據可信;反之,P<0.05時,需要考慮以下問題:1.
被調查的群體是否處於遺傳平衡狀態;2.遺傳標記(如SNP)分型的技術或標准是否出現誤差;3.是否達到隨機抽樣的要求。特別是后兩點需要注意!
哈代-溫伯格定律,也稱“遺傳平衡定律”或“哈代-溫伯格平衡定律”,分別在1908年和1909年由英國數學家G·H·哈代(GodfreyHaroldHardy)和德國醫生溫伯格(WilhelmWeinberg)獨立證明。在群體遺傳學中,哈代-溫伯格定律主要用於描述群體中等位基因頻率以及基因型頻率之間的關系。
對於兩個等位基因的哈代-溫伯格定律:橫軸表示兩個等位基因頻率p和q,而縱軸表示基因型頻率。每條線表示一種基因型頻率。
主要內容為:
一個群體在理想情況(不受特定的干擾因素影響,如非隨機交配、選擇、遷移、突變或群體大小有限),經過多個世代,基因頻率與基因型頻率會保持恆定並處於穩定的平衡狀態。
實際上,總會存在一個或多個干擾因素。因此,哈代-溫伯格定律在自然界中是不可能的。基因的平衡是一種理想狀態,並用於測量遺傳改變的基准。
最簡單的例子是位於單一位點的兩個等位基因:顯性等位基因記為A而隱性等位基因記為a,它們的頻率分別記為p和q。頻率(A)=p;頻率(a)=q;p+q=1。如果群體處於平衡狀態,則我們可以得到
群體中純合子AA的頻率(AA)=p2
群體中純合子aa的頻率(aa)=q2
群體中雜合子Aa的頻率(Aa)=2pq
這些頻率稱為哈代-溫伯格平衡。無限大小的群體經過一個世代的隨機交配,基因型頻率就能達到平衡。在沒有其它因素的影響下,這種平衡狀態將一直保持。
一個群體在理想情況(不受特定的干擾因素影響,如非隨機交配、選擇、遷移、突變或群體大小有限),經過多個世代,基因頻率與基因型頻率會保持恆定並處於穩定的平衡狀態。
實際上,總會存在一個或多個干擾因素。因此,哈代-溫伯格定律在自然界中是不可能的。基因的平衡是一種理想狀態,並用於測量遺傳改變的基准。
最簡單的例子是位於單一位點的兩個等位基因:顯性等位基因記為A而隱性等位基因記為a,它們的頻率分別記為p和q。頻率(A)=p;頻率(a)=q;p+q=1。如果群體處於平衡狀態,則我們可以得到
群體中純合子AA的頻率(AA)=p2
群體中純合子aa的頻率(aa)=q2
群體中雜合子Aa的頻率(Aa)=2pq
這些頻率稱為哈代-溫伯格平衡。無限大小的群體經過一個世代的隨機交配,基因型頻率就能達到平衡。在沒有其它因素的影響下,這種平衡狀態將一直保持。
人類基因組中連鎖不平衡(linkage disequiibrium, LD)
人類基因組中連鎖不平衡(linkage disequiibrium, LD)的程度和分布情況在基因定位中極其重要,無論是作為復雜疾病精細定位時的工具,還是作為未來全基因組關聯分析的基礎。另外,連鎖不平衡的知識還有助於有關人類的歷史和起源,染色體重組等的研究。本節將從連鎖不平衡的理論基礎,如何應用在復雜疾病的研究中,這一方法存在的局限性,以及一些統計遺傳軟件的介紹來試圖給出這一遺傳疾病研究的重要工具的大概。 連鎖不平衡分析的群體遺傳學基礎 連鎖不平衡的含義 連鎖不平衡又稱等位基因關聯(allelic association),其原理其實很簡單。假定兩個緊密連鎖的位點1,2,各有兩個等位基因(A,a; B,b),那么在同一條染色體上將有四種可能的組合方式:A-B,A-b,a-B,和a-b。假定等位基因A的頻率為Pa,B的頻率為Pb,那么如果不存在連鎖不平衡(如組成單倍型的等位基因間相互獨立,隨機組合)單倍型A-B的頻率就應為PaPb。而如果A與B是相關聯的,單倍型A-B的頻率則應為PaPb+δ,δ是表示兩位點間LD程度的值。如果位點2上的等位基因B與疾病易患性有關,那么將會觀察到等位基因A的頻率在病人群體中高於對照群體。換句話說,等位基因A與該疾病性狀相關。事實上,可以檢測遍布基因組中的大量遺傳標記位點,或者候選基因附近的遺傳標記來尋找到因為與致病位點距離足夠近而表現出與疾病相關的位點,這就是等位基因關聯分析或連鎖不平衡定位基因的基本思想。 產生和破壞連鎖不平衡的因素 基因組中緊密連鎖的基因位點在隨機交配的群體中經過許多世代的重復交換而被隨機化,出現了連鎖平衡。概括地說,連鎖不平衡可能有如下三個原因:1,被考察的群體來源於等位基因頻率不同的群體,而且兩個群體混合的時間不足以產生完全的隨機化。2,兩個基因位點之間的距離非常接近,以至於尚未經歷足夠的世代來被重組分開。3,某些連鎖基因位點的等位基因的組合(單倍型)通過自然選擇保持較高的頻率。當由於以上原因群體開始偏離連鎖平衡時,達到新的平衡所需的時間取決於基因位點間連鎖的緊密程度:連鎖越緊密,達到平衡的時間就越長。 |