獲取基因的所有轉錄本(不同亞型)的外顯子區域


        1. 基因轉錄本亞型

        蛋白質亞型或“蛋白質變體“是一組高度相似的蛋白質成員,這些成員來源於單個基因或基因家族,是遺傳差異造成的結果。雖然許多具有相同或相似的生物學作用,但一些亞型具有獨特的功能。這些高度相似的蛋白質亞型可以由可變剪切(圖1)、可變啟動子或單基因的其他轉錄后修飾形成,通常不考慮翻譯后修飾。通過RNA剪切機制,mRNA具有從基因中選擇不同蛋白質編碼區(外顯子)的能力,甚至是從RNA中選擇外顯子的不同部分以形成不同的mRNA序列,每個獨特的mRNA序列產生獨特的蛋白質。

圖1 可變剪切產生不同的轉錄本和蛋白質

        1.1 可變剪切

  可變剪切依據外顯子之間連接位置的不同,又可以具體細分為如下(圖2)幾種剪切方式:

    • 組成型拼接
    • 外顯子跳躍拼接
    • 內含子保留拼接
    • 相互排斥的外顯子拼接
    • 替代5’端剪切
    • 替代3'端剪切

圖2 不同的RNA剪切機制

 

 

        2. 基因所有亞型外顯子區域獲取

    樓主想研究一個基因所有外顯子區域,而不是單獨一個轉錄本的外顯子區域,因此需要獲取該基因的所有轉錄本信息,這里備選三個數據庫(NCBI、Ensembl和UCSC)供使用,以BRCA1為例。

  2.1 使用NCBI數據庫獲取BRCA1基因的所有外顯子區域

    2.1.1 選擇“Gene”數據庫,輸入基因名(例如,“BRCA1”),點“Search”按鈕搜索

    2.1.2 根據物種(例如,“human”),點擊相應基因鏈接

 

    2.1.3 查看轉錄本個數,點擊“GenBank”進入詳情

    2.1.4 點擊“Send to”,按下圖所示選擇相應的項,點擊“Create File”創建“gff3”格式文件

  
  如圖所示,得到BRCA1基因區域所有“feature”的物理位置,包括外顯子。

  2.2 使用Ensembl數據庫獲取BRCA1基因的所有外顯子區域

    2.2.1 物種選擇“Human”數據庫,輸入基因名(例如,“BRCA1”),點“Go”按鈕搜索

    2.2.2 選擇“BRCA1”鏈接,查看詳細

     2.2.3 如圖所示,“BRCA1”共有33個轉錄本,點擊“Export data”按鈕,配置相關參數導出數據

 

     2.2.4 選擇輸出格式為“gff3”,輸出內容只選擇“exon”,然后點擊“next”,如下圖所示

  2.3 使用UCSC數據庫獲取BRCA1基因的所有外顯子區域

  使用UCSC數據庫,需要安裝MySQL客戶端鏈接UCSC數據庫(不建議使用)

    2.3.1 鏈接UCSC數據庫

  

   2.3.2 查詢基因“BRCA1”,共有6個記錄

 

         3. 小結

        NCBI、Ensembl和UCSC均可以對基因的轉錄本的所有外顯子進行查詢,推薦使用Ensembl數據庫,其次NCBI數據庫,最后UCSC數據庫。

 

參考資料

NCBI

Ensembl

UCSC


免責聲明!

本站轉載的文章為個人學習借鑒使用,本站對版權不負任何法律責任。如果侵犯了您的隱私權益,請聯系本站郵箱yoyou2525@163.com刪除。



 
粵ICP備18138465號   © 2018-2025 CODEPRJ.COM