SNPs概念
在基因組水平上由單個核苷酸的變異所引起的DNA序列多態性。即:在不同個體的同一條染色體或同一位點的核苷酸序列中,絕大多數核苷酸序列一致而只有一個鹼基不同的現象。
只涉及到單個核苷酸鹼基的變化,包括鹼基的置換或顛換,插入和缺失等,但后兩種少見。
從理論上來看每一個SNP 位點都可以有4 種不同的變異形式,但實際上發生的只有兩種,即轉換和顛換,二者之比為2 :1。SNP 在CG序列上出現最為頻繁,而且多是C轉換為T ,原因是CG中的C 常為甲基化的,自發地脫氨后即成為胸腺嘧啶。一般而言,SNP 是指變異頻率大於1 %的單核苷酸變異。在人類基因組中大概每1000 個鹼基就有一個SNP ,人類基因組上的SNP 總量大概是3 ×106 個 。
因此,SNP成為第三代遺傳標志,人體許多表型差異、對葯物或疾病的易感性等等都可能與SNP有關。
現在普遍認為SNP研究是人類基因組計划走向應用的重要步驟。這主要是因為SNP將提供一個強有力的工具,用於高危群體的發現、疾病相關基因的鑒定、葯物的設計和測試以及生物學的基礎研究等。SNP在基因組中分布相當廣泛,近來的研究表明在人類基因組中每300鹼基對就出現一次。大量存在的SNP位點,使人們有機會發現與各種疾病,包括腫瘤相關的基因組突變;從實驗操作來看,通過SNP發現疾病相關基因突變要比通過家系來得容易;有些SNP並不直接導致疾病基因的表達,但由於它與某些疾病基因相鄰,而成為重要的標記。SNP在基礎研究中也發揮了巨大的作用,近年來對Y染色體SNP的分析,使得在人類進化、人類種群的演化和遷徙領域取得了一系列重要成果。
SNP自身的特性決定了它更適合於對復雜性狀與疾病的遺傳解剖以及基於群體的基因識別等方面的研究:
1、 SNP數量多,分布廣泛。據估計,人類基因組中每1000個核苷酸就有一個SNP,人類30億鹼基中共有300萬以上的SNPs。SNP 遍布於整個人類基因組中,根據SNP在基因中的位置,可分為基因編碼區SNPs(Coding-region SNPs,cSNPs)、基因周邊SNPs(Perigenic SNPs,pSNPs)以及基因間SNPs(Intergenic SNPs,iSNPs)等三類。
2、 SNP適於快速、規模化篩查。組成DNA的鹼基雖然有4種,但SNP一般只有兩種鹼基組成,所以它是一種二態的標記,即二等位基因(biallelic)。 由於SNP的二態性,非此即彼,在基因組篩選中SNPs往往只需+/-的分析,而不用分析片段的長度,這就利於發展自動化技術篩選或檢測SNPs。
3、 SNP等位基因頻率的容易估計。采用混和樣本估算等位基因的頻率是種高效快速的策略。該策略的原理是:首先選擇參考樣本制作標准曲線,然后將待測的混和樣本與標准曲線進行比較,根據所得信號的比例確定混和樣本中各種等位基因的頻率。
4、 易於基因分型。SNPs 的二態性,也有利於對其進行基因分型。對SNP進行基因分型包括三方面的內容:(1)鑒別基因型所采用的化學反應,常用的技術手段包括:DNA分子雜交、引物延伸、等位基因特異的寡核苷酸連接反應、側翼探針切割反應以及基於這些方法的變通技術;(2)完成這些化學反應所采用的模式,包括液相反應、固相支持物上進行的反應以及二者皆有的反應。(3)化學反應結束后,需要應用生物技術系統檢測反應結果。
MAF(Minor Allele Frequency):最小等位基因頻率
