SNPs & MAF


SNPs,全稱是single nucleotide polymorphisms,SNPs等位基因頻率的容易估計。采用混和樣本估算等位基因的頻率是種高效快速的策略。該策略的原理是:首先選擇參考樣本制作標准曲線,然后將待測的混和樣本與標准曲線進行比較,根據所得信號的比例確定混和樣本中各種等位基因的頻率。

SNPs概念 

  在基因組水平上由單個核苷酸的變異所引起的DNA序列多態性。即:在不同個體的同一條染色體或同一位點的核苷酸序列中,絕大多數核苷酸序列一致而只有一個鹼基不同的現象。

  只涉及到單個核苷酸鹼基的變化,包括鹼基的置換或顛換,插入和缺失等,但后兩種少見。

  從理論上來看每一個SNP 位點都可以有4 種不同的變異形式,但實際上發生的只有兩種,即轉換和顛換,二者之比為2 :1。SNP 在CG序列上出現最為頻繁,而且多是C轉換為T ,原因是CG中的C 常為甲基化的,自發地脫氨后即成為胸腺嘧啶。一般而言,SNP 是指變異頻率大於1 %的單核苷酸變異。在人類基因組中大概每1000 個鹼基就有一個SNP ,人類基因組上的SNP 總量大概是3 ×106 個 。
  因此,SNP成為第三代遺傳標志,人體許多表型差異、對葯物或疾病的易感性等等都可能與SNP有關。
  現在普遍認為SNP研究是人類基因組計划走向應用的重要步驟。這主要是因為SNP將提供一個強有力的工具,用於高危群體的發現、疾病相關基因的鑒定、葯物的設計和測試以及生物學的基礎研究等。SNP在基因組中分布相當廣泛,近來的研究表明在人類基因組中每300鹼基對就出現一次。大量存在的SNP位點,使人們有機會發現與各種疾病,包括腫瘤相關的基因組突變;從實驗操作來看,通過SNP發現疾病相關基因突變要比通過家系來得容易;有些SNP並不直接導致疾病基因的表達,但由於它與某些疾病基因相鄰,而成為重要的標記。SNP在基礎研究中也發揮了巨大的作用,近年來對Y染色體SNP的分析,使得在人類進化、人類種群的演化和遷徙領域取得了一系列重要成果。

SNPs意義

SNP自身的特性決定了它更適合於對復雜性狀與疾病的遺傳解剖以及基於群體的基因識別等方面的研究:

1、   SNP數量多,分布廣泛。據估計,人類基因組中每1000個核苷酸就有一個SNP,人類30億鹼基中共有300萬以上的SNPs。SNP 遍布於整個人類基因組中,根據SNP在基因中的位置,可分為基因編碼區SNPs(Coding-region SNPs,cSNPs)、基因周邊SNPs(Perigenic SNPs,pSNPs)以及基因間SNPs(Intergenic SNPs,iSNPs)等三類。

2、  SNP適於快速、規模化篩查。組成DNA的鹼基雖然有4種,但SNP一般只有兩種鹼基組成,所以它是一種二態的標記,即二等位基因(biallelic)。 由於SNP的二態性,非此即彼,在基因組篩選中SNPs往往只需+/-的分析,而不用分析片段的長度,這就利於發展自動化技術篩選或檢測SNPs。

3、  SNP等位基因頻率的容易估計。采用混和樣本估算等位基因的頻率是種高效快速的策略。該策略的原理是:首先選擇參考樣本制作標准曲線,然后將待測的混和樣本與標准曲線進行比較,根據所得信號的比例確定混和樣本中各種等位基因的頻率。

4、  易於基因分型。SNPs 的二態性,也有利於對其進行基因分型。對SNP進行基因分型包括三方面的內容:(1)鑒別基因型所采用的化學反應,常用的技術手段包括:DNA分子雜交、引物延伸、等位基因特異的寡核苷酸連接反應、側翼探針切割反應以及基於這些方法的變通技術;(2)完成這些化學反應所采用的模式,包括液相反應、固相支持物上進行的反應以及二者皆有的反應。(3)化學反應結束后,需要應用生物技術系統檢測反應結果。

 

MAF(Minor Allele Frequency):最小等位基因頻率

簡介:
最小等位基因頻率通常是指在給定人群中的不常見的等位基因發生頻率,例如TT,TC,CC三個基因型,在人群中C的頻率=0.36,T的頻率=0.64,則等位基因C就為最小等位基因頻率,MAF=0.36。
作用:
Hapmap計划將MAF>0.05的SNPs作為首要研究目標,MAF廣泛應用於復雜疾病的全基因組關聯研究。在關聯研究中,較小的MAF將會使統計效能降低,從而造成假陰性的結果。為了研究人群中罕見突變與疾病的關聯,通常通過加大樣本量的方法來彌補MAF降低所帶來的統計效能的損失。在研究中,這一突變位點往往屬於同一基因或同一通路上一組罕見突變中的一個。
此外,已知MAF還可以估算樣本量或檢驗效能,並可以確定基因型的頻率。
eg.G is a MAF=0.40 , freq(A)=1-freq(G)=1-0.40=0.60
so,
freq_(AA)=0.60*0.60
freq_(AG)=2*0.40*0.60
freq_(GG)=0.40*0.40
 
等位基因頻率是群體遺傳學的術語,用來顯示一個 種群中基因的多樣性,或者說是基因庫的豐富程度。
等位基因頻率的定義如下:
如果 1)一個染色體中存在某特定 基因座,2)該基因座上有一個基因,3)一個 種群中的每一個個體的體細胞都有n個該特定基因座(例如 二倍體生物的細胞中有兩個該特定基因座),4)該基因有位基因或變種;那么 等位基因頻率為-------等位基因在這個種群中 所有該等位基因在特定基因座中 所占的百分比。
舉例來說,如果在某 種群中一個等位基因的基因頻率為20%,那么在種群的所有成員中,1/5的染色體帶有那個等位基因,而其他4/5的染色體帶有該 等位基因的其他對應變種--可以是一種也可以是很多種。
如人們熟悉的人的MN血型,它是由一對 共顯性等位基因M和N所決定,產生3種基因型M/M、M/N和N/N,而相應的表型是M、MN和N,而且比例是1/4M、1/2MN和1/4N。這個原理可以推廣到一般群體內婚配,如以群體中MN表型( 基因型)的具體樣本數被所觀察到總數相除即可得到(轉換)相對頻率數。
 
基因頻率是某種基因在某個 種群中出現的比例。 基因型頻率是某種特定基因型的個體占群體內全部個體的比例。前者是某基因個體數占全部基因數的比例,后者是某基因型個體數占群體總數的比例。

相關計算

⑴設二倍體生物個體的某一 基因座上有兩個 等位基因A和a,假設 種群中共有N個個體,而AA、Aa、aa三種 基因型的個體數分別為n1、n2、n3,那么種群中A基因的頻率和AA基因型的頻率分別是:
①A基因的頻率=A基因的總數/(A基因的總數+a基因的總數)=(2n1+n2)/2N 或 n1/N+n2/2N
②AA基因型的頻率=AA基因型的個體數/該二倍體群體總數=n1/N。
⑵基因頻率與 基因型頻率的計算關系,由上述①②推得:A基因的頻率=n1/N+1/2·n2/N=AA基因型的頻率+1/2Aa基因型的頻率。
 


免責聲明!

本站轉載的文章為個人學習借鑒使用,本站對版權不負任何法律責任。如果侵犯了您的隱私權益,請聯系本站郵箱yoyou2525@163.com刪除。



 
粵ICP備18138465號   © 2018-2025 CODEPRJ.COM