基因和突變那些事


基因是什么?——gene,allele,genotype

這里講的是英文中對應的概念,並非是通常意義上的基因。
通俗講,把一條染色體比喻成一列車位,每個車位存放的車的類型不同,有的是工程類的,用來干活的;有的是普通的小轎車,用來拉人的;有的是玩具車,用來玩的,那么gene就是這個車位,allele就是具體的車的牌子,型號。也就是說,gene表示這個車位的用途,allele表示這個車的性能。當有兩條染色體時,就會有兩列車位,同一排的gene,就會有兩輛車,這兩輛車的牌子,如果相同,而且都是性能好的,就叫顯性純合子,都是性能差的,就叫隱性純合子;如果不相同,那就叫雜合子。
我們也可以把gene翻譯成基因座,allele譯為等位基因。同一個基因座上,只要序列不同,就是不同的allele,所以,突變(例如:SNP)會使得allele數目變多。

那么,什么是突變?

突變

常說的基因突變,本質,是在核酸序列相同位點上,我的一段核酸序列和你的一段核酸序列不一樣。突變其實就是不同,只是把針對與參考序列的不同叫做了突變。常見的不同又叫做多態性,比如SNP。

突變的獲得方式:

  • 從父母各自的卵子中獲得,叫胚系突變(germline mutation)。
  • 受精卵發育過程中獲得,全身細胞都有的,叫新發突變(de nove mutation)。
  • 單獨在各自組織細胞中發生的突變,不能遺傳的,叫體細胞突變(somatic mutation)。

突變的類型:

突變的類型主要有替換(substitution),缺失(deletion),插入(insertion),倒位(inversion)。在不同的尺度上,這些突變類型有所不同。下面具體介紹

  • 染色體倍數改變 Chromosomal aneuploidy
    如21三體綜合征
  • 基因組結構變異Structural Variations (SVs)與拷貝數變異Copy Number Variations (CNVs)
    一般來講,SV常被定義為DNA上大於1 kb 片段的變更,如:缺失突變(deletions),插入突變(insertions)等。CNV 是基因組結構變異的重要組成部分,一般指長度為1 kb 以上的基因組大片段的拷貝數增加或者減少, 主要表現為亞顯微水平的缺失和重復。
  • 插入缺失Short insertion/deletions (Indels)
    指的是在基因組的某個位置上所發生的小片段序列的插入或者刪除,其長度通常在50bp以下。Indel是導致癌症激酶活化的常見機制。比如KRAS是一種激酶,某種突變會讓它獲得持續的激活,從而使癌細胞失控。
  • 單核苷酸變異Single Nucleotide Variations (SNVs)
    SNV是基因組水平上由單個核苷酸的變異,一般來說每個人的基因組都會有300萬個單核苷酸的變異,可能出現在編碼區、非編碼區、基因間區。

突變對編碼區域的影響

通常,突變對編碼區的影響是針對於SNVs和Indels(insertion和deletion)。因為長片段的突變,通常會影響到編碼區。

  • (A)錯義突變(missense mutation):
    DNA的突變引起mRNA中密碼子改變,編碼另一種氨基酸。如G12A,表示第12號密碼子由 G 突變為 A(其中 G 為野生型氨基酸 ,12 是氨基酸突變位置,A 為突變型氨基酸);錯義突變造成不同氨基酸的替代,可能使得到的蛋白質無功能。例如,從AAA到AGA的變化將導致從編碼賴氨酸到編碼精氨酸的變化,但精氨酸與賴氨酸化學性質相似。在這樣一種情況下,突變對表型幾乎沒有影響,因此該突變是中性的。
  • (B)無義突變(nonsense mutation):
    如 G12, 表示第 12 號密碼子由 G 突變為終止密碼子,代表編碼終止;無義突變通常引起蛋白的功能異常,為致病突變。
  • (C)同義突變(samesense mutation):
    是指鹼基被替換之后 ,產生新的密碼子,但由於生物的遺傳密碼子存在簡並現象,新舊密碼子仍是同義斷碼子,所編碼的氨基酸種類保持不變,因此同義突變通常不產生突變效應。
  • (D)移碼突變(frameshift mutation):
    在正常的DNA中,鹼基缺失或增加非3的整倍數,造成這位置之后的一系列編碼發生移位錯誤的改變。如 p.D1866Rfs*17,表示第 1866 位氨基酸由 D 突變為 R,並繼續編碼 16 個氨基酸后終止;
  • (E)整碼突變(inframe mutation):
    如 c.295_297delGGC,p.G99del 表示核苷酸發生 3 的整數倍的缺失或插入,導致編碼蛋白發生缺失或插入相應氨基酸。
  • (F)剪切突變(splicing mutation):
    如 BRCA1 c.5152+1G>T,表示 BRCA1 基因第 5152 核苷酸交界內含子區域第 1 位核苷酸發生突變,鹼基由 G 突變為 T;
  • (G)融合突變:
    如 EML4-ALK 融合,表示基因 EML4 與 ALK 發生融合變異;融合突變是非常重要的一種突變形式。
  • (H)終止密碼子突變:
    與無義突變相反,鹼基替換后使某一終止密碼子變成具有氨基酸編碼功能的遺傳密碼子,使本應終止延伸的多肽鏈合成異常地持續進行。
  • (I)經典剪切位點突變:
    轉錄的過程中會發生剪切,GT……AG是經典剪切位點, 某一位點突變會影響剪切。
  • (J)動態突變:
    某些單基因遺傳形狀的異常或疾病的發生,是由於DNA分子中某些短串聯重復序列,尤其是基因編碼序列或側翼序列的三核苷酸重復擴增引起。三核苷酸重復的次數可隨着世代的傳遞而呈現逐代遞增的累加突變效應,因而被稱為動態突變。已知的動態突變性疾病已超過30余種,如Huntington病,脆性X綜合征、脊髓小腦共濟失調、強直性肌營養不良等。
  • (K)多態性變異(SNP):
    單核苷酸多態性(single nucleotide polymorphism,SNP),DNA序列多態性又稱為遺傳多態性:指同一物種的不同個體、不同群體之間的DNA序列的差異性。大多數SNP是不致病的。
    SNP的特點主要有:
    (1)密度高/分布廣:人類基因組中每1000個核苷酸就有一個SNP,人類30億鹼基中共有300萬以上的SNPs。SNP 遍布於整個人類基因組中,可位於基因編碼區、基因的非編碼區以及基因間區(基因和基因之間)。
    (2)富有代表性:某些位於基因內部的SNP 有可能直接影響蛋白質結構或表達水平, 因此, 它們可能代表疾病遺傳機理中的某些作用因素。SNP自身的特性決定了它更適合於對復雜性狀與疾病的遺傳解剖以及基於群體的基因識別等方面的研究。
    (3)遺傳穩定性:與微衛星等重復序列多態性標記相比, SNP 具有更高的遺傳穩定性。

SNP,SNV,CNV

SNP針對以某個SNV在群體中的多態性,當某個SNV在群體中的比例 >0.1% 時,會將這個SNV稱作SNP。
CNV,只是在測序結果的比對過程中,發現的某段序列拷貝數的增多或減少,並不能確定他的位置。因為NGS都打散了,比對到參考序列的同一個位置上了。
具體的可參考:https://blog.csdn.net/weixin_39690958/article/details/112482178

以上對突變的遺傳性,類型,有害性,做了簡單的總結,那么問題又來了,參考序列是什么?

參考序列

人類基因組計划(HGP)/人類單倍型圖譜計划(HapMap)/千人基因組計划(1000G)

為了獲得參考序列,上世紀,開始了人類基因組計划,就是把一個人的基因組序列測出來。當時,測的不止一個人,具體幾個忘了,但肯定不超過10個。測完發現,壞了,好多同一個位置不一樣的啊,那參考個屁啊。但是呢,這些人又都是健康的,所以就把這種不一樣叫了個高大上的名字——單核苷酸多態性(SNP)。也就是說,參考序列,其實不是一個人的序列,而是多個人的序列,組裝在一塊的,比如用常見的序列替換不常見的(我猜的,具體的組裝規則不清楚)。
SNP,是一個針對群體的概念,那當初就測了幾個人,那算群體?肯定不算,所以又搞了一個人類單倍型圖譜計划,用來檢測SNP。但是HapMap測的人數不夠(當時還沒有NGS),SNP的檢測效力只有5%~10%,於是就有了千人基因組計划。1000G的SNP檢測效力達到了1%。

參考基因組版本

目前最新的參考基因組版本,也是最為准確的組裝,由基因組參考聯合會 (Genome Reference Consortium)發布,正式名稱為GRCh38(Genome Research Consortium human build 38),也被稱為hg38(Human genome build 38, UCSC發布的版本),初版發布於2013年12月。


參考:
https://blog.sciencenet.cn/blog-479743-472592.html
https://www.yourgenome.org/facts/what-types-of-mutation-are-there
https://zhuanlan.zhihu.com/p/384473911
https://zhuanlan.zhihu.com/p/123205250
https://blog.csdn.net/weixin_39690958/article/details/112482178


免責聲明!

本站轉載的文章為個人學習借鑒使用,本站對版權不負任何法律責任。如果侵犯了您的隱私權益,請聯系本站郵箱yoyou2525@163.com刪除。



 
粵ICP備18138465號   © 2018-2025 CODEPRJ.COM