群體遺傳學習筆記-基礎篇


鏈接:https://www.jianshu.com/p/c489da8e75ff

 

群體遺傳學介紹

傳統群體遺傳學是基於觀察到的等位基因頻率與預期頻率的分析。例如,在Wright-Fisher模型下,你可能會看到有性繁殖的二倍體個體群體,而且這些種群沒有重疊世代。該模型忽略了諸如突變,重組,選擇或種群大小或結構變化等影響。更復雜的模型可以包含在實際群體中觀察到的影響的不同方面。然而,大多數這些模型都假設群體是以性方式繁殖的。

群體是指生活在一定空間范圍內,能夠相互交配並生育具有正常生殖能力后代的同種個體群。群體與個體相對,是個體的共同體,不同個體按某種特征結合在一起,進行共同活動、相互交往,就形成了群體。

有效群體大小:指與實際群體有相同基因頻率方差或相同雜合度衰減率的理想群體含量,通常小於絕對的群體大小。

A locus (基因座)是基因組中的一個位置,我們可以在不同的個體中觀察一個或幾個等位基因。假定群體遺傳學中使用的基因座是選擇性中性的,可以是anonymous或非編碼區,如微衛星基因座(SSR),單核苷酸多態性(SNP)。

A genotytpe (基因型)是特定基因座上給定個體攜帶的等位基因的組合。攜帶同一組等位基因的個體被認為具有相同的多基因座基因型 (MLG)。

基因型頻率,群體中某一基因型個體占群體總個數的比例。可以反映某一基因型個體在群體中的相對數量。在群體遺傳學中基因型頻率指在一個種群中某種基因型的所占的百分比。

群體中基本度量標准是多態性,等位基因頻率和基因型頻率。多態性可以通過多種方式進行估計,例如觀察到的多個等位基因的總數。

等位基因頻率是群體遺傳學的術語,用來顯示一個種群中基因的多樣性,或者說是基因庫的豐富程度。在一個群體中,等位基因頻率即某類等位基因占該基因位點上全部等位基因數的比率。如:在某種群中一個等位基因的基因頻率為20%,那么在種群的所有成員中,1/5的染色體帶有那個等位基因,而其他4/5的染色體帶有該等位基因的其他對應變種—可以是一種也可以是很多種。

遺傳平衡定律(哈迪-溫伯格定律):是指在理想狀態下,各等位基因的頻率和等位基因的基因型頻率在遺傳中是穩定不變的,即保持着基因平衡。例:當等位基因只有一對(Aa)時,設基因A的頻率為p,基因a的頻率為q,則A+a=p+q=1,AA+Aa+aa=p2+2pq+q2=1。哈迪-溫伯格平衡定律(Hardy-Weinberg equilibrium) 對於一個大且隨機交配的種群,基因頻率和基因型頻率在沒有遷移、突變和選擇的條件下會保持不變。

群體分析

群體分析一般可以分為,分層分析和選擇分析。分層分析可以定義為,基於群體內個體之間基因序列上的差異。群體選擇分析是在群體水平在基因組不同區域遺傳多樣性的差異。

分層分析:

  • 系統發育研究:一般使用發育樹研究具有共同祖先之間進化關系,探究物種進化的關系和分類的關系。
  • PCA(主成分分析):用較少不相關的變量替代原始大量相關的變量,來研究群體分層,亞種之前的進化關系。
  • 群體結構分析:研究大群體中存在基因頻率不同的亞群,一般可以用來推斷祖先群,個體血緣組成,還有雜交事件。

選擇分析
選擇清除分析:自然選擇促使有利突變在群體中保留下來,與之連鎖的中性位點突變頻率提升,非連鎖的中性位點突變頻率下降;簡單的說就是基因組某區域由於受到了選擇而消除多態性,即遺傳多樣性降低,在群體中出現高頻的等位基因和低頻的等位基因。主要用於:挖掘馴化過程中受選擇的基因和挖掘物種適應性進化過程中受選擇的基因。

適合度-分析是指生物體或生物群體對環境適應的量化特征,是分析估計生物所具有的各種特征的適應性,以及在進化過程中繼續往后代傳遞的能力的指標。適合度是衡量一個個體存活和繁殖成功機會的尺度。適合度越大,個體成活的機會和繁殖成功的機會也越大,反之則相反(因此義項與廣義適合度相對應,故亦可稱之為狹義適合度)。

計算方式:適合度可以用數據計算出來:W=ml。其中,W代表適合度,m表示基因型個體生育力,l表示基因型個體存活率。

常用的統計方法:
θπ、θW,Tajima's D,Fst。

θπ:群體中任意兩條不同序列(個體)的鹼基差異數(SNP)取平均值。

  1. 手人工選擇的群體,遺傳多樣性相對單一,θπ值較小
  2. 野生群體遺傳多樣性大,θπ值比較大
  3. 單個群體內部基因型多樣性(0-1),多樣性越大,θπ越大。

θW:基於全部序列內分離位點個數

此處輸入圖片的描述
此處輸入圖片的描述

中性檢驗(Tajima's D)

此處輸入圖片的描述
此處輸入圖片的描述

Tajima’D = (θπ–θW)/Var(θπ–θW)

  • θπ = θw Tajima's D = 0,中性進化;
  • θπ < θw Tajima’s D < 0:群體中存在許多低頻率的等位基因(稀有等位基因),則θW增大而θT不受影響(或影響較小),由定向選擇或群體擴張引起;
  • θπ > θw Tajima’s D > 0:群體中高等/中等頻率的等位基因較多, θT增大而θW 不受影響,由於平衡選擇和瓶頸效應引起的。

平衡選擇與定向選擇都屬於正選擇的范疇,因此,只要D值顯著背離0,就可能是自然選擇的結果;而當D值不顯著背離0時,則中性突變

Fst:群體間遺傳分化指數,是種群分化和遺傳距離的一種衡量方法,分化指數越大,差異越大。

Fst= (πBetween-πWithin)/πBetween
πBetween:來自群體間的所有兩兩個體間差異的均值
πWithin:來自亞群內所有兩兩個體間差異的均值

正選擇vs負選擇

此處輸入圖片的描述
此處輸入圖片的描述

positive selection (正選擇):自然選擇“選留”一些稀少的等位基因,擁有這些等位基因的個體能繁殖更多的后代;這樣的突變基因往往具有與原來基因不同的功能,而且該功能使得擁有它的生物更能適應環境。

negative selection(負選擇):指群體中出現有害突變等位基因時,攜帶該等位基因的個體會因為生存力或育性降低而從群體中淘汰,也叫凈化選擇。

選擇清除vs背景選擇

此處輸入圖片的描述
此處輸入圖片的描述

選擇清除:在有利突變產生后被正選擇固定的過程中,與之連鎖的中性位點的變異也被固定。
背景選擇:負選擇在清除有害突變時,也會隨之清除與其連鎖的中性位點的變異。

選擇清除和背景選擇都會導致基因組上受選擇的區域遺傳多樣性下降,兩者很難區分,但背景選擇在群體中不會導致高頻等位基因突變出現。

連鎖不平衡(Linkage disequilibrium, LD):指群體內不同位點等位基因間的非隨機性組合的關系,即當位於同一條染色體的兩個等位基因(A,B)同時存在的概率,大於群體中因隨機分布而同時出現的概率時,就稱這兩個點處於LD狀態。通常用D’和r2值表示。一般來說,在連鎖不平衡分析中, 野生種的 LD 值較低,而馴化種由於受到了正選擇的作用,LD 值就會偏大。

此處輸入圖片的描述
此處輸入圖片的描述

瓶頸效應:由於環境驟變(如火災、地震、洪水等)或人類活動(如人工選擇、馴化),使得某一生物種群的規模迅速減少,僅有一少部分個體能夠順利通過瓶頸事件,在之后的恢復期內產生大量后代。

此處輸入圖片的描述
此處輸入圖片的描述

 

遷移壓力(又叫基因流):由於某種原因,具有某一基因頻率的群體的一部分移入基因頻率與其不同的另一群體,並雜交定居,就會引起遷入群體的基因頻率發生改變。

此處輸入圖片的描述
此處輸入圖片的描述


作者:lakeseafly
鏈接:https://www.jianshu.com/p/c489da8e75ff
來源:簡書
簡書著作權歸作者所有,任何形式的轉載都請聯系作者獲得授權並注明出處。


免責聲明!

本站轉載的文章為個人學習借鑒使用,本站對版權不負任何法律責任。如果侵犯了您的隱私權益,請聯系本站郵箱yoyou2525@163.com刪除。



 
粵ICP備18138465號   © 2018-2025 CODEPRJ.COM